如何進(jìn)行遷移學(xué)習(xí)?對(duì)產(chǎn)品經(jīng)理有什么啟發(fā)?

3 評(píng)論 4112 瀏覽 17 收藏 9 分鐘

遷移是機(jī)器學(xué)習(xí)中一種常見的方法,可以通過遷移學(xué)習(xí),將一些建好的學(xué)習(xí)模型通過遷移的方式來加速訓(xùn)練過程。

遷移學(xué)習(xí)概述

遷移學(xué)習(xí)是人工智能機(jī)器學(xué)習(xí)中的一種(除了遷移學(xué)習(xí)還有深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)),將一個(gè)開發(fā)模型應(yīng)用到其他任務(wù)或是類型中,也就是在機(jī)器處理全新的領(lǐng)域時(shí),難以獲取大量數(shù)據(jù)取構(gòu)建模型時(shí)可以通過遷移學(xué)習(xí)的方法,通過少量數(shù)據(jù)訓(xùn)練從而適用于新領(lǐng)域。通俗來講,遷移學(xué)習(xí)就是一種舉一反三的學(xué)習(xí)方法。

比如:我們學(xué)會(huì)了彈吉他,我們?cè)偃W(xué)習(xí)鋼琴、小提琴等其他樂器,可以節(jié)約好多時(shí)間,我們可以從學(xué)習(xí)吉他中的樂理知識(shí)、音階等相關(guān)知識(shí),遷移到其他樂器中,從而降低我們學(xué)習(xí)的成本,節(jié)約學(xué)習(xí)的時(shí)間。

遷移是機(jī)器學(xué)習(xí)中一種常見的方法,通常應(yīng)用到計(jì)算機(jī)視覺、自然語(yǔ)言處理等相關(guān)人工智能領(lǐng)域,通過神經(jīng)網(wǎng)路學(xué)習(xí)需要大量數(shù)據(jù)、長(zhǎng)時(shí)間的計(jì)算,某些情況下我們難以獲取足夠的資源,所以我們通過遷移學(xué)習(xí)的方式,將一些建好的學(xué)習(xí)模型通過遷移的方式來加速訓(xùn)練過程。

如何進(jìn)行遷移學(xué)習(xí)?

在理解如何進(jìn)行遷移學(xué)習(xí)中,我們先了解一下如下定義:

域:一個(gè)域 D 由一個(gè)特征空間 X 和特征空間上的邊際概率分布 P(X) 組成,其中 X=x1,x2,…xn 。舉個(gè)例子:對(duì)于一個(gè)有文檔,其有很多詞袋表征(bag-of-words representation)X 是所有文檔表征的空間,而 xi 是第 i 個(gè)單詞的二進(jìn)制特征。P(X)代表對(duì)X的分布。

任務(wù):在給定一個(gè)域 D={X,P(X)} 之后,一個(gè)任務(wù) T 由一個(gè)標(biāo)簽空間 y 以及一個(gè)條件概率分布 P(Y/X) 構(gòu)成,其中,這個(gè)條件概率分布通常是從由特征—標(biāo)簽對(duì) xi,yi組成的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)得到。

源域:在遷移學(xué)習(xí)中,我們已有的知識(shí)叫做源域。

目標(biāo)域:在遷移學(xué)習(xí)中,要學(xué)習(xí)的新知識(shí)叫目標(biāo)域。

以上概念如果不是專門做AI技術(shù)的同學(xué)可能很難理解,那我們舉個(gè)例子來解釋一下:

有一個(gè)養(yǎng)狗的高手,對(duì)不同的狗狗的類型都能分辨出來,能夠識(shí)別不同狗狗的特征。有一天想去賣賣貓貓了,他就從養(yǎng)狗狗的經(jīng)驗(yàn)上去學(xué)習(xí)貓貓,分辨貓貓,發(fā)現(xiàn)按照狗狗狗的特征是難以正確的分辨貓貓的,因此他又重新學(xué)習(xí)了貓貓的特征。

在以上案例中:域就是貓貓或狗狗,源域就是狗狗,目標(biāo)域就是貓貓,任務(wù)就是貓貓或狗狗的特征或是特點(diǎn),這樣說就好理解了。

在遷移學(xué)習(xí)中有不同的方法:

1. 基于實(shí)例的遷移學(xué)習(xí)方法

意思是說在源域中找到與目標(biāo)域相似的數(shù)據(jù),把這個(gè)數(shù)據(jù)的權(quán)值進(jìn)行調(diào)整,讓目標(biāo)域與源域權(quán)值數(shù)據(jù)進(jìn)行匹配,然后對(duì)調(diào)整的數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),不斷的調(diào)整權(quán)值,最終形成目標(biāo)域的模型。

這種屬于源域中的樣本進(jìn)行遷移,也就是樣本與樣本之間相似度較高的情況,我們看如下圖片(以下圖片來自于百度):

2. 基于特征的遷移學(xué)習(xí)方法

意思是說通過源域與目標(biāo)域相同的特征進(jìn)行提取,找到共同特征,然后學(xué)習(xí)。它與基于實(shí)例的遷移學(xué)習(xí)方法,不同在于——基于實(shí)例的是從實(shí)際數(shù)據(jù)中進(jìn)行選擇來匹配與目標(biāo)域相似的部分,進(jìn)行學(xué)習(xí),基于特征的是找到源域與目標(biāo)域的相同交集特征,進(jìn)行學(xué)習(xí)。

如下圖所示(圖片來自于百度):

3. 基于模型的遷移學(xué)習(xí)方法

意思是說通過源域訓(xùn)練好的模型,直接應(yīng)用到目標(biāo)域中,通過目標(biāo)域中少量數(shù)據(jù)去訓(xùn)練此模型,進(jìn)行學(xué)習(xí),比如:你有一個(gè)識(shí)別狼狗的模型,這個(gè)模型可以男出來訓(xùn)練哈士奇。

4.基于關(guān)系的遷移學(xué)習(xí)方法

意思是說當(dāng)兩個(gè)域是有某些相似的時(shí)候,他們之間存在某種關(guān)系,我們可以根據(jù)域中的相同的關(guān)系背后邏輯進(jìn)行遷移,比如:生物病毒傳播的規(guī)律遷移到電腦病毒的傳播規(guī)律。

遷移學(xué)習(xí)對(duì)我們產(chǎn)品經(jīng)理的啟發(fā)

通過對(duì)遷移學(xué)習(xí)的概述以及遷移學(xué)習(xí)的方法的介紹,我們總結(jié)一下遷移學(xué)習(xí)使用場(chǎng)景:

  1. 數(shù)據(jù)量不足的問題:一方面是因?yàn)槟承╊I(lǐng)域,數(shù)據(jù)量比較少;一方面是因?yàn)槭占罅繑?shù)據(jù)需要較高的資源和成本,我們需要考慮通過遷移學(xué)習(xí)的方法。
  2. 個(gè)性化方面的問題:通過群體數(shù)據(jù),難以反映一個(gè)個(gè)體的特征。

對(duì)于我們產(chǎn)品經(jīng)理,我們?cè)谠O(shè)計(jì)產(chǎn)品或是設(shè)計(jì)某些邏輯的時(shí)候,可以看一下我們?cè)O(shè)計(jì)場(chǎng)景是否符合遷移學(xué)習(xí)的使用場(chǎng)景,我們?nèi)绻ㄟ^遷移學(xué)習(xí)的方法,去解決我們的產(chǎn)品設(shè)計(jì)問題。

比如以下案例:

數(shù)據(jù)量成本案例

比如:不同產(chǎn)品用戶評(píng)價(jià)模型的遷移,一個(gè)產(chǎn)品好或者壞,我們需要分析大量用戶的評(píng)價(jià),通過對(duì)評(píng)價(jià)的標(biāo)注,建立評(píng)價(jià)模型但。是如果我們有大量產(chǎn)品,并且不同用戶有不同的用戶評(píng)價(jià)習(xí)慣,不同的用語(yǔ),來表達(dá)對(duì)產(chǎn)品的好或是壞,我們很難收集到全面的用戶評(píng)價(jià)數(shù)據(jù)。

因此,我們只需要從少量產(chǎn)品大量數(shù)據(jù)評(píng)價(jià)中去標(biāo)注,去訓(xùn)練,找打標(biāo)注模型,通過此模型應(yīng)用到其他產(chǎn)品中,我們就可以迅速分辨出這個(gè)產(chǎn)品的在用戶眼里是好或者是壞。

個(gè)性化推薦案例

比如:我們有一個(gè)售賣書籍的電商平臺(tái),根據(jù)用戶偏好、行為等對(duì)其做了智能推薦,然后我們想在電商平臺(tái)上新增了電影推薦內(nèi)容。

假如我們想在這個(gè)產(chǎn)品一上線就能智能推薦給用戶,這時(shí)候我們可以使用書籍的智能推薦方案遷移到電影內(nèi)容推薦這個(gè)產(chǎn)品上,比如:某一用戶群體喜歡懸疑類書籍,那我們可以推薦一些懸疑類電影內(nèi)容。

再比如:我們一個(gè)新APP冷啟動(dòng)時(shí)的個(gè)性化推薦,是否可以利用之前已上線APP的用戶畫像描述,通過特征遷移的方式,做個(gè)性化推薦?

本文通過對(duì)遷移學(xué)習(xí)的介紹,希望我們產(chǎn)品經(jīng)理我們?cè)O(shè)計(jì)產(chǎn)品在考慮后臺(tái)設(shè)計(jì)邏輯時(shí)有一些啟發(fā)!

 

本文由 @?羅飛 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 很棒,學(xué)習(xí)了

    來自上海 回復(fù)
    1. 多謝多謝!

      來自北京 回復(fù)