AI產(chǎn)品經(jīng)理的入門必修——概念篇

8 評論 13960 瀏覽 128 收藏 17 分鐘

編輯導(dǎo)語:隨著各行各業(yè)的豐富,產(chǎn)品經(jīng)理的崗位職責(zé)也越來越細(xì)致;如今科技發(fā)展迅速,AI人工智能已經(jīng)開始深入生活中,AI產(chǎn)品經(jīng)理也需要掌握一定的技能;本文作者分享了關(guān)于AI產(chǎn)品經(jīng)理的學(xué)習(xí)概念分享,我們一起來看一下。

經(jīng)過近幾年來的發(fā)展,產(chǎn)品經(jīng)理的崗位職責(zé)劃分的越來越細(xì),對能力的要求也越來越高。

很多剛接手做AI產(chǎn)品的童鞋會困擾,到底需要對人工智能技術(shù)掌握到什么程度才能夠勝任好這份工作;筆者通過自身的學(xué)習(xí)經(jīng)驗,期望能以此篇文章為剛?cè)胄谢蛘呦肴胄械耐蜷_一些學(xué)習(xí)思路。

一、工欲善其事,必先利其器

AI產(chǎn)品經(jīng)理除了要掌握通用的產(chǎn)品技能,需要具有更強(qiáng)的專業(yè)性、廣博性和條理性;AI技術(shù)作為一種新的生產(chǎn)力,處理了過往技術(shù)無法處理的復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)。

很多人在使用機(jī)器學(xué)習(xí)時,喜歡簡單粗暴的將數(shù)據(jù)丟給算法模型,期望從數(shù)據(jù)中自己得到結(jié)論;AI絕不是將手中的數(shù)據(jù)喂給它,就能夠解決我們的業(yè)務(wù)問題。

很多公司老板容易AI超神論,認(rèn)為我們掌握了技術(shù),擁有了人才,就能夠建立自己的護(hù)城河;作為產(chǎn)品經(jīng)理需要清楚的理解機(jī)器學(xué)習(xí)的使用場景和邊界,清晰定位問題才能尋找新的市場機(jī)會。

1. 產(chǎn)品規(guī)劃:五看三定原則

五看三定模型其實是華為的戰(zhàn)略管理框架,現(xiàn)在把它結(jié)合到產(chǎn)品的工作中。

1)五看包括:

看行業(yè)/趨勢:

  • 結(jié)合公開的行業(yè)數(shù)據(jù)、現(xiàn)有的業(yè)務(wù)數(shù)據(jù)、產(chǎn)品數(shù)據(jù)分析未來趨勢走向,為業(yè)務(wù)發(fā)展尋找新的增長點(diǎn)。
  • 不僅要看宏觀的經(jīng)濟(jì)因素還要從群體思想、政治關(guān)系等角度去切入,可以結(jié)合PEST方法進(jìn)行分析,即政治、經(jīng)濟(jì)、社會、技術(shù)分別分析企業(yè)的外部環(huán)境。

看市場/客戶:確定需求強(qiáng)度,需求可替代性,以及客戶的持續(xù)付費(fèi)能力。

看競爭:當(dāng)前市場的競爭態(tài)勢,有多少玩家在里面,分別占據(jù)了怎樣的市場份額。

看自己:評估內(nèi)部資源,現(xiàn)有的產(chǎn)品矩陣。

看機(jī)會:是否存在彎道超車的機(jī)會,做到人無我有,人有我優(yōu)。

2)三定包括:

定控制點(diǎn):簡單可理解為一種不易被構(gòu)建及超越的中長期競爭力,控制有不同的維度,如成本優(yōu)勢、功能性能的領(lǐng)先、技術(shù)的壁壘、品牌與客戶關(guān)系、絕對的市場份額等。

定目標(biāo):制定清晰的戰(zhàn)略目標(biāo),并拆解為最小任務(wù),分步執(zhí)行、監(jiān)控、評估。

定策略:策略即戰(zhàn)術(shù),策略的制定決定了后續(xù)的資源分配、系統(tǒng)如何組成。

2. 選擇產(chǎn)品類型

在開展新的業(yè)務(wù)線時,首先問自己幾個問題:我們的護(hù)城河在哪?最終產(chǎn)品形態(tài)是什么樣子?我們?yōu)槭袌鎏峁┝嗽鯓拥慕鉀Q方案?服務(wù)方式?服務(wù)能力?

面對不同的業(yè)務(wù)線首先要做到戰(zhàn)略洞察所處環(huán)境與價值分析,制定清晰的戰(zhàn)略目標(biāo)和策略,通過五看三定原則合理的找到產(chǎn)品定位。

先發(fā)型產(chǎn)品:

擁有最快路徑、利用產(chǎn)業(yè)升級進(jìn)行驅(qū)動、建立核心門檻和護(hù)城河、資源消耗輕、塑造行業(yè)標(biāo)準(zhǔn)。

趕超型產(chǎn)品:

擁有最優(yōu)路徑、差異化的競爭驅(qū)動、對標(biāo)核心競品,尋找機(jī)會、研發(fā)資源投入較多、達(dá)到行業(yè)標(biāo)準(zhǔn)以上、做好客戶服務(wù)。

二、數(shù)據(jù)需要懂多少?

1. 建立數(shù)據(jù)認(rèn)知

數(shù)據(jù)與信息的關(guān)系:

數(shù)據(jù)反映在事物屬性的記錄上,而信息是具體事物的表現(xiàn)形式,即數(shù)據(jù)經(jīng)過加工和處理后,可揭示和轉(zhuǎn)化為信息。

信息被識別后表示的符號為數(shù)據(jù)。

  • 數(shù)據(jù)可以是連續(xù)的值比如聲音、圖像,也可以是離散的值,比如文字、符號;
  • 計算機(jī)系統(tǒng)中,數(shù)據(jù)是以二進(jìn)制0、1形式表示;

結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù):

結(jié)構(gòu)化的數(shù)據(jù)簡單可以理解為數(shù)據(jù)庫中的數(shù)據(jù),可以結(jié)合具體的使用場景易于理解的數(shù)據(jù)。

非結(jié)構(gòu)化的數(shù)據(jù)是指沒有進(jìn)行預(yù)定義,并且不方便用二維邏輯來表現(xiàn)和解釋的數(shù)據(jù),比如文本、圖片、音頻、視頻。

何為臟數(shù)據(jù):數(shù)據(jù)不再我們預(yù)先定義的范圍內(nèi)或?qū)嶋H業(yè)務(wù)無意義。

2. 了解數(shù)據(jù)的業(yè)務(wù)內(nèi)涵

理解數(shù)據(jù)的業(yè)務(wù)內(nèi)涵是非常關(guān)鍵的一步,這要求產(chǎn)品經(jīng)理對業(yè)務(wù)的各個流程和關(guān)鍵節(jié)點(diǎn)要非常的熟悉,理解數(shù)據(jù)代表的含義;遇到模糊、定義不清晰的數(shù)據(jù)要充分與業(yè)務(wù)部門溝通,準(zhǔn)確了解數(shù)據(jù)內(nèi)涵。

業(yè)務(wù)數(shù)據(jù)包含但不局限于:

  • 用戶數(shù)據(jù):用戶ID、性別、年齡、地區(qū)、手機(jī)號…
  • 行為數(shù)據(jù):點(diǎn)擊、分享、收藏、停留時間…
  • 產(chǎn)品數(shù)據(jù):商品數(shù)據(jù)、訂單數(shù)據(jù)、文章數(shù)據(jù)、詳情頁數(shù)據(jù)…

業(yè)務(wù)指標(biāo)包含但不局限于:

  • 用戶指標(biāo):新增用戶、活躍用戶數(shù)、留存用戶數(shù)..
  • 行為指標(biāo):訪問次數(shù)、轉(zhuǎn)化率、轉(zhuǎn)發(fā)率、流失率..
  • 產(chǎn)品指標(biāo):總量、收入、銷量、好評率、差評率、成交量…

業(yè)務(wù)數(shù)據(jù)不獨(dú)立存在,基于不同的業(yè)務(wù)背景可傳達(dá)出不同的含義,數(shù)據(jù)的計算重組可發(fā)揮出極大的業(yè)務(wù)價值,需要基于自身的工作場景挖掘數(shù)據(jù)內(nèi)涵。

3. 數(shù)據(jù)處理流程和方法

數(shù)據(jù)處理流程包含了數(shù)據(jù)采集->數(shù)據(jù)處理->數(shù)據(jù)分析->數(shù)據(jù)應(yīng)用->持續(xù)跟蹤和驗證。

數(shù)據(jù)采集:

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

數(shù)據(jù)處理:

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

數(shù)據(jù)分析:

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

數(shù)據(jù)應(yīng)用:

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

除此之外根據(jù)具體要解決的業(yè)務(wù)問題,還需要完成業(yè)務(wù)建模、數(shù)學(xué)建模、經(jīng)驗數(shù)據(jù)分析,此部分通常由數(shù)據(jù)分析師進(jìn)行,產(chǎn)品經(jīng)理涉及較少。

三、機(jī)器學(xué)習(xí)是什么?

機(jī)器學(xué)習(xí)為計算機(jī)提供了不同的數(shù)據(jù)處理方法,這些處理數(shù)據(jù)的方法可以直接從數(shù)據(jù)中學(xué)習(xí),不需要額外的編程即可做出預(yù)測。

我們可以將機(jī)器學(xué)習(xí)簡單理解為函數(shù),像理解y=x2 一樣,給到一個輸入項,通過公式的計算即可得出一個對應(yīng)的計算結(jié)果;這個公式不需要編碼預(yù)設(shè)邏輯,由數(shù)據(jù)的規(guī)律計算得出。

機(jī)器學(xué)習(xí)過程分為訓(xùn)練階段和預(yù)測階段。

訓(xùn)練階段需要提前準(zhǔn)備一定的歷史數(shù)據(jù)(即公式的x和y),通過機(jī)器學(xué)習(xí)算法,訓(xùn)練出一套可計算的公式(即模型)。

預(yù)測階段就是拿真實的數(shù)據(jù)(x),在訓(xùn)練好的模型上進(jìn)行輸入,觀察輸出的結(jié)果(y),是否符合預(yù)期,若符合預(yù)期即完成了一個機(jī)器學(xué)習(xí)模型的訓(xùn)練。

1. 從任務(wù)來看

機(jī)器學(xué)習(xí)解決的問題可以歸為分類問題、預(yù)測問題。

分類問題包含二分類、多分類,顧名思義,二分類問題是非此即彼的問題,如垃圾郵件,只存在是垃圾郵件、不是垃圾郵件。

圖片識別問題,是植物不是植物。

多分類問題如文檔自動歸類,包含了一對多,多對多的關(guān)系。

預(yù)測問題通常第一反應(yīng)就會想到回歸,因為常被用來預(yù)測公司收入、業(yè)務(wù)增長量、商品銷量。

需要預(yù)估的通常都是連續(xù)值,試圖將輸入變量和輸出用一個連續(xù)函數(shù)對應(yīng)起來。

而分類問題,通常預(yù)測的都是離散值,試圖將輸入變量與離散的類別對應(yīng)起來。

還有一類特殊的解決問題的模型為結(jié)構(gòu)化學(xué)習(xí)模型,通常輸出的數(shù)據(jù)不再是一個固定長度的值,比如圖片語義分析,對應(yīng)輸出的是圖片對應(yīng)的文字描述。

2. 從機(jī)器學(xué)習(xí)方法來看

機(jī)器學(xué)習(xí)分為有監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、遷移學(xué)習(xí)、強(qiáng)化學(xué)習(xí)。

  • 有監(jiān)督:訓(xùn)練樣本帶有標(biāo)簽;
  • 半監(jiān)督:訓(xùn)練樣本部分有標(biāo)簽,部分無標(biāo)簽;
  • 無監(jiān)督:訓(xùn)練樣本全部無標(biāo)簽;
  • 遷移學(xué)習(xí):把已經(jīng)訓(xùn)練好的模型參數(shù)遷移到新的模型上來幫助新模型的訓(xùn)練;
  • 強(qiáng)化學(xué)習(xí):也叫學(xué)習(xí)最優(yōu)策略,是可以讓本體在特定環(huán)境下,根據(jù)不同狀態(tài)做出行動,以此來獲得最大回報。

3. 從模型類別來看

機(jī)器學(xué)習(xí)模型主要分為線性模型、非線性模型。

線性模型是指因變量和自變量之間按比例表現(xiàn)出線性對應(yīng)關(guān)系,包含了線性回歸、多項式回歸。

公式表現(xiàn)為——h(x)=w1x1+w2x2+?+wnxn+b

非線性模型通常是指因變量與自變量間不能在坐標(biāo)空間中表現(xiàn)出線性對應(yīng)關(guān)系。

常見的SVM、KNN、決策樹、深度學(xué)習(xí)都屬于非線性模型。

提到線性、非線性模型,我們必須要了解一下什么是損失函數(shù),通常在模型訓(xùn)練的過程中,我們需要觀察h(x)與y之間的差距,也就是均方誤差,在線性模型中表現(xiàn)為L(h)=m∑i=1(y(i)?h(x(i)))2,在模型訓(xùn)練過程中,損失函數(shù)是作為度量函數(shù)好壞的標(biāo)準(zhǔn)。

需要注意的是在面對不同的問題時,所使用的損失函數(shù)形式是存在差異的,常見的損失函數(shù)有均方差損失函數(shù)、交叉熵?fù)p失函數(shù)、合頁損失函數(shù),通常會配合不同的算法使用做出突出表現(xiàn)。

4. 常見的誤差

泛化誤差:可以分解為偏差、方差和噪聲之和。

偏差:反映了模型在樣本上的期望輸出與真實標(biāo)記之間的差距,指模型本身的精準(zhǔn)度,以及擬合能力。

方差:反映了模型在不同訓(xùn)練數(shù)據(jù)集下學(xué)得的函數(shù)的輸出與期望輸出之間的誤差,通常是為了測試模型的穩(wěn)定性,觀察預(yù)估結(jié)果的波動情況。

在模型訓(xùn)練過程中,需要根據(jù)實際情況來權(quán)衡模型的復(fù)雜度,使偏差和方差得到均衡,以整體誤差最小的原則去評估。

5. 常見的問題

模型訓(xùn)練中常常遇到欠擬合、過擬合的情況,那么怎么識別及解決呢?

欠擬合:通常是指模型刻畫不夠,解決方案通常有三種。

  • 尋找更好的特征提升數(shù)據(jù)刻畫能力。
  • 增大數(shù)據(jù)集數(shù)量。
  • 模型復(fù)雜度低,重新選擇更加復(fù)雜的模型。

過擬合:與欠擬合相反,模型刻畫太細(xì),泛化能力太差。

通常解決方案為:

  • 減少特征的維度,將高維空間密度增大,也就是通常說的降維。
  • 加入正則化項,使模型褶皺減少,更加平滑。

四、算法需要懂多少?

確認(rèn)算法的流程通常是由產(chǎn)品經(jīng)理和算法工程師共同完成,包含:需求確定 -> 算法設(shè)計 -> 算法討論 -> 算法確認(rèn) -> 算法驗收 -> 持續(xù)改進(jìn)。

算法模型的選擇和訓(xùn)練是個繁瑣且復(fù)雜的過程,依賴于具體所解決問題的復(fù)雜程度。產(chǎn)品經(jīng)理除了要明確定位要解決的核心問題,還需要了解模型訓(xùn)練的整個流程。

很多人會說產(chǎn)品經(jīng)理不需要了解這么多,不是還有算法工程師嗎?

理想情況下,如果你的算法工程師能夠充分了解要解決的業(yè)務(wù)場景,并將數(shù)據(jù)可解決問題的上限、下限劃定清楚,產(chǎn)品經(jīng)理只需驗收數(shù)據(jù)效果即可。

但通常情況下,算法工程師距離業(yè)務(wù)線較遠(yuǎn),而機(jī)器學(xué)習(xí)強(qiáng)依賴于數(shù)據(jù)表現(xiàn),產(chǎn)品經(jīng)理對業(yè)務(wù)數(shù)據(jù)的識別能力,通常能夠極大的加快整體進(jìn)度,在訓(xùn)練過程中能夠及時識別問題并調(diào)整策略及解決方案。

產(chǎn)品經(jīng)理對算法的掌握到底需要達(dá)到什么程度呢?

個人認(rèn)為只需要掌握常見算法模型的原理和使用場景,以及不同算法在解決不同問題的優(yōu)勢和劣勢,合理組合和使用即可滿足日常的工作需求。不需要糾結(jié)于具體的算法推導(dǎo)過程。

五、機(jī)器學(xué)習(xí)常見的算法模型

針對不同的使用場景,scikit-learn(python機(jī)器學(xué)習(xí)庫)上有封裝好的機(jī)器學(xué)習(xí)算法模型可以支持我們直接調(diào)用。

下圖為人工整理的關(guān)于不同場景及數(shù)據(jù)集下建議使用的算法模型,僅供學(xué)習(xí)和參考。

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

下期將介紹具體的機(jī)器學(xué)習(xí)訓(xùn)練過程,包含如何梳理業(yè)務(wù)邏輯、需求轉(zhuǎn)化、準(zhǔn)備數(shù)據(jù)集、建立算法模型、模型評估及訓(xùn)練過程中常出現(xiàn)的問題與解決方案。

#專欄作家#

大鵬,公眾號:一個數(shù)據(jù)人的自留地。人人都是產(chǎn)品經(jīng)理專欄作家,《數(shù)據(jù)產(chǎn)品經(jīng)理修煉手冊》作者。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議。

作者:一個圓圈兒

本文由 @一個數(shù)據(jù)人的自留地 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自 Pixabay,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 不錯

    來自上海 回復(fù)
  2. 想入行的菜雞,沒看懂。。。

    來自浙江 回復(fù)
  3. 最后一個圖。。。

    來自江蘇 回復(fù)
  4. 平安健康

    回復(fù)
  5. 好文比較全面,能提供一些案例就更好了

    回復(fù)
  6. 好文,最后一張圖看不太清就是了

    來自北京 回復(fù)
  7. 希望繼續(xù)寫下去,對剛?cè)胄腥藛T很有幫助

    來自浙江 回復(fù)
  8. 寫的很好!很適合入門,不過感覺對非本領(lǐng)域的還是不太友好地!

    來自福建 回復(fù)