AI產(chǎn)品經(jīng)理進化指南:基礎(chǔ)入門

0 評論 2800 瀏覽 19 收藏 16 分鐘

AI產(chǎn)品的爆火,讓不少人都希望做AI產(chǎn)品經(jīng)理。但不是那么容易的,光是AI領(lǐng)域的這些基礎(chǔ)名詞,你知道多少呢?

DeepSeek實現(xiàn)信息整合和建議輸出,Manus則直接具備獨立完成復(fù)雜任務(wù)的閉環(huán)執(zhí)行能力,從DeepSeek到Manus爆火,前后不足2個月,技術(shù)更新的很快。AI成為標配,產(chǎn)品經(jīng)理也要持續(xù)更新迭代,在不確定的時代始終給自己一份確定感。

進化指南系列從AI基礎(chǔ)入門、應(yīng)用實踐、場景挖掘三個方面通俗易懂地記錄、分享AI學(xué)習(xí)與實踐。

基礎(chǔ)入門部門,系統(tǒng)地梳理大模型和AI基礎(chǔ)知識,建立AI領(lǐng)域的基礎(chǔ)語言,理解現(xiàn)有大模型的能力范圍和邊界,知道大模型能做哪些事情,不能做哪些事情。

AI產(chǎn)品、AI企業(yè)、AI產(chǎn)品經(jīng)理

人工智能產(chǎn)品=數(shù)據(jù)+算法+算力

如果把人工智能產(chǎn)品比如剛剛開始學(xué)習(xí)的小孩,數(shù)據(jù)就是學(xué)習(xí)用的 “課本” 和 “資料”,數(shù)據(jù)越多學(xué)習(xí)的素材就越多;算法是學(xué)習(xí)的方法,不同的算法就像不同的學(xué)習(xí)方法,有的方法可能學(xué)習(xí)得又快又準,有的可能就會慢一些或者容易出錯;算力:相當(dāng)于 “大腦運轉(zhuǎn)速度”,算力強就算的快,算力弱就有可能卡頓或處理不過來。

AI企業(yè)

分為基礎(chǔ)層企業(yè)、技術(shù)層企業(yè)、應(yīng)用層企業(yè)

AI=基礎(chǔ)層:做AI核心技術(shù)的公司,比如提供AI算法模型的Deepseek,提供算法芯片的英偉達

AI+=技術(shù)層:對于基礎(chǔ)AI能力進行包裝和優(yōu)化,輸出通用方案的公司,比如計算機視覺、語音識別及語義處理

+AI=應(yīng)用層:結(jié)合人工智能技術(shù)進行業(yè)務(wù)賦能,直接解決業(yè)務(wù)場景問題的公司,金融+AI、工業(yè)+AI、能源+AI等等。

AI產(chǎn)品經(jīng)理

把AI技術(shù)包裝為新產(chǎn)品或融入舊產(chǎn)品,用新方法解決用戶需求的人。

在這樣的要求下,就需要產(chǎn)品經(jīng)理了解AI技術(shù)原理,能夠進行解釋說明,理解現(xiàn)有AI的能力范圍和邊界,知道AI能做哪些事情,不能做哪些事情。

經(jīng)典算法模型

CNN 算法(卷積神經(jīng)網(wǎng)絡(luò))

【原理】

可以把 CNN 算法想象成一個專業(yè)的圖像檢查員。當(dāng)你拿到一張復(fù)雜的大圖片時,要從中找出關(guān)鍵信息是很困難的。CNN 就像檢查員一樣,它不會一下子看完整張圖片,而是把圖片劃分成一個個小區(qū)域,使用特定的 “小窗口”(卷積核)在這些小區(qū)域上滑動查看。

這個 “小窗口” 會檢查每個小區(qū)域的特征,比如邊緣、顏色變化等。每檢查完一個小區(qū)域,就會輸出一個表示該區(qū)域特征的數(shù)值。隨著 “小窗口” 在整個圖片上滑動,就能得到很多這樣的數(shù)值,這些數(shù)值組成了一個新的 “特征圖”。

CNN 會使用多個不同的 “小窗口”,得到多個不同的特征圖,每個特征圖關(guān)注圖片的不同方面。之后,它會對這些特征圖進行處理,比如通過池化操作減少數(shù)據(jù)量,保留重要信息。最后,把處理后的特征輸入到全連接層,就像做總結(jié)一樣,根據(jù)這些特征判斷圖片的類別。

【應(yīng)用場景】

圖像識別:在安防領(lǐng)域,用于識別監(jiān)控畫面中的人臉、車輛型號等;在醫(yī)療領(lǐng)域,幫助醫(yī)生識別 X 光、CT 等影像中的病變。

自動駕駛:識別道路上的交通標志、行人、其他車輛等,為自動駕駛決策提供依據(jù)。

RNN 算法(循環(huán)神經(jīng)網(wǎng)絡(luò))

【原理】

RNN 就像是一個有 “記憶” 的智能助手,專門處理和時間序列相關(guān)的數(shù)據(jù)。當(dāng)你給它輸入一系列數(shù)據(jù)時,它不僅僅關(guān)注當(dāng)前輸入的數(shù)據(jù),還會記住之前輸入的數(shù)據(jù)信息。

比如,當(dāng)你輸入一段文字時,RNN 會依次處理每個單詞。在處理當(dāng)前單詞時,它會結(jié)合之前處理過的單詞信息來理解句子的意思。這是因為 RNN 有一個循環(huán)結(jié)構(gòu),它會把上一個時間步的輸出作為當(dāng)前時間步的一部分輸入,這樣就可以保留歷史信息。

不過,傳統(tǒng)的 RNN 存在 “長時依賴” 問題,也就是很難記住很久之前的信息。后來出現(xiàn)了 LSTM(長短期記憶網(wǎng)絡(luò))和 GRU(門控循環(huán)單元)等改進版本,它們能更好地控制信息的記憶和遺忘,解決了長時依賴問題。

【應(yīng)用場景】

自然語言處理:用于機器翻譯,將一種語言的句子逐詞處理并結(jié)合上下文信息,翻譯成另一種語言;文本生成,如寫新聞稿、詩歌等,根據(jù)前文內(nèi)容生成后續(xù)的文本。

語音識別:識別連續(xù)的語音信號,結(jié)合之前聽到的語音片段來準確識別整個句子的內(nèi)容。

GAN 算法(生成對抗網(wǎng)絡(luò))

【原理】

GAN 算法由兩個 “對手” 組成,一個是生成器,另一個是判別器,它們就像兩個在進行比賽的選手。

生成器的任務(wù)是生成數(shù)據(jù),比如生成圖像、文本等。一開始,生成器生成的數(shù)據(jù)質(zhì)量很差,很容易被識別出來是假的。判別器的任務(wù)是判斷輸入的數(shù)據(jù)是真實數(shù)據(jù)還是生成器生成的假數(shù)據(jù)。

生成器會不斷學(xué)習(xí),嘗試生成更逼真的數(shù)據(jù)來騙過判別器;而判別器也會不斷提高自己的判斷能力,準確區(qū)分真假數(shù)據(jù)。在這個對抗的過程中,生成器和判別器的能力都不斷提升,最終生成器能夠生成非常逼真的數(shù)據(jù)。

【應(yīng)用場景】

圖像生成:生成逼真的人臉、風(fēng)景等圖像,在游戲開發(fā)、影視制作中用于創(chuàng)建虛擬場景和角色。

數(shù)據(jù)增強:在訓(xùn)練機器學(xué)習(xí)模型時,通過 GAN 生成更多的訓(xùn)練數(shù)據(jù),提高模型的泛化能力和性能。例如,在醫(yī)學(xué)圖像領(lǐng)域,生成更多的病理圖像用于訓(xùn)練疾病診斷模型。

決策式AI和生成式AI

決策式 AI

【原理】

建立一個樣本歸屬于特定類別的概率,再對新的場景進行判斷、分析和預(yù)測。決策式 AI先學(xué)習(xí)大量已有的數(shù)據(jù)和規(guī)則,當(dāng)遇到新的問題或情況時,它就會把當(dāng)前的信息和自己學(xué)到的知識進行對比分析,按照一定的算法和邏輯,衡量各種可能的行動方案,最后選出它認為最合適的決策,就好像參謀根據(jù)戰(zhàn)場形勢和以往經(jīng)驗給出作戰(zhàn)策略一樣。

【應(yīng)用場景】

交通信號控制:根據(jù)實時的車流量、行人數(shù)量等數(shù)據(jù),決策式 AI 決定什么時候該亮紅燈、綠燈,以優(yōu)化交通流量,減少擁堵。

人臉識別,決策式AI對實時獲取的人臉圖像進行特征信息提取,再與人臉庫中的特征數(shù)據(jù)匹配,從而實現(xiàn)人臉識別。

決策式AI可以通過學(xué)習(xí)電商平臺上海量用戶的消費行為數(shù)據(jù),制訂最合適的推薦方案,盡可能提升平臺交易量。

生成式 AI

【原理】

生成式 AI 同樣會學(xué)習(xí)大量已有的數(shù)據(jù),比如很多的圖片、文字、音頻等。但它不是簡單地根據(jù)規(guī)則做決策,而是在學(xué)習(xí)這些數(shù)據(jù)的模式和規(guī)律后,發(fā)揮 “想象力”,按照這些學(xué)到的模式來創(chuàng)造全新的內(nèi)容,像生成一幅畫、寫一篇文章、創(chuàng)作一段音樂等,生成的內(nèi)容看起來就像是人類創(chuàng)作的一樣。

【應(yīng)用場景】

現(xiàn)在比較火熱的 ChatGPT、Deepseek等大型語言模型這些都是生成式AI,可以生成生成文字、圖片、視頻等等。

這里推薦大家去看丁磊的《生成式人工智能》這本書,對生成式AI介紹很透徹。

常用AI算法

語音識別

【原理】

它先學(xué)習(xí)大量的語音樣本,記住不同語音對應(yīng)的文字內(nèi)容。當(dāng)接收到新的語音時,就把這個語音和它學(xué)過的樣本進行比對,找出最匹配的文字內(nèi)容。

【應(yīng)用場景】

智能音箱如小愛同學(xué)、天貓精靈,用戶可以通過語音讓它播放音樂、查詢天氣等;汽車的語音控制系統(tǒng),讓駕駛員通過語音操作導(dǎo)航、調(diào)節(jié)空調(diào)等。

虛擬現(xiàn)實(VR)和增強現(xiàn)實(AR)

【原理】

VR 是打造一個完全虛擬的世界,設(shè)備會根據(jù)人的動作和視角變化,實時調(diào)整虛擬場景的顯示,讓人感覺自己真的身處這個虛擬世界中。AR 則是把虛擬的信息疊加到現(xiàn)實場景中,通過攝像頭捕捉現(xiàn)實畫面,然后將虛擬元素融入其中展示給用戶。

【應(yīng)用場景】

VR 常用于游戲,讓玩家有沉浸式的游戲體驗;也用于一些培訓(xùn)場景,如飛行員模擬訓(xùn)練。AR 在教育領(lǐng)域,可以讓學(xué)生通過手機或平板看到書本上的虛擬立體模型;在導(dǎo)航中,能將路線信息疊加在現(xiàn)實道路畫面上。

深度學(xué)習(xí)

【原理】

可以想象成一個有很多層的知識大廈,深度學(xué)習(xí)通過構(gòu)建多層的神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)數(shù)據(jù)。它結(jié)合了有監(jiān)督和半監(jiān)督學(xué)習(xí),在學(xué)習(xí)過程中,數(shù)據(jù)在神經(jīng)網(wǎng)絡(luò)的各層之間傳遞和處理,每一層都會提取出不同層次和抽象程度的特征,最終實現(xiàn)對數(shù)據(jù)的深度理解和分析。

【應(yīng)用場景】

人臉識別,用于門禁系統(tǒng)、安防監(jiān)控;工業(yè)生產(chǎn)中的產(chǎn)品質(zhì)量檢測,通過識別產(chǎn)品外觀缺陷來保證產(chǎn)品質(zhì)量。

針對 AI 優(yōu)化的硬件和芯片(如攝像頭)

【原理】

這些硬件和芯片是專門為了讓 AI 運行得更快、更高效而設(shè)計的。以攝像頭為例,它要快速、準確地捕捉圖像或視頻數(shù)據(jù),并且要能和 AI 算法很好地配合,把數(shù)據(jù)高效地傳輸給 AI 系統(tǒng)進行處理。

【應(yīng)用場景】

安防監(jiān)控攝像頭,配合人臉識別、行為分析等 AI 算法,實時監(jiān)控公共場所的安全情況;智能手機攝像頭,利用 AI 算法實現(xiàn)拍照美化、場景識別等功能。

生物特征識別技術(shù)

【原理】

就像給每個人設(shè)置了一個獨一無二的 “密碼鎖”。系統(tǒng)先學(xué)習(xí)每個人的生物特征(如指紋的紋路、面部的特征點、虹膜的圖案等),把這些特征轉(zhuǎn)化為數(shù)字代碼存儲起來。當(dāng)有人進行身份驗證時,系統(tǒng)會采集當(dāng)前的生物特征,和存儲的代碼進行比對,如果匹配就驗證通過。

【應(yīng)用場景】

家用指紋鎖,保障家庭安全;機場、高鐵站的人臉識別閘機,加快旅客通關(guān)速度。

機器人流程自動化(RPA)

【原理】

用戶輸入具體的業(yè)務(wù)需求和規(guī)則,RPA 會按照這些規(guī)則自動執(zhí)行一系列的操作,就像人在電腦上進行的各種操作一樣,如數(shù)據(jù)錄入、文件處理、報表生成等,從而節(jié)省人力和時間。

【應(yīng)用場景】

金融行業(yè)的銀行賬戶對賬、保險理賠處理;企業(yè)的財務(wù)報銷流程自動化。

自然語言處理(NLP)

【原理】

通過對大量文本數(shù)據(jù)的學(xué)習(xí),分析語言的語法、語義和語用等信息??梢愿兄h(huán)境數(shù)據(jù)(如新聞報道中的事件信息)、行為數(shù)據(jù)(如用戶在社交媒體上的發(fā)言),進行情感分析(判斷文本是積極、消極還是中性情感),還能識別人的身份(通過對話內(nèi)容中的特征),結(jié)合智能穿戴設(shè)備收集的數(shù)據(jù)來分析人的精神狀態(tài)。

【應(yīng)用場景】

智能客服,自動回答客戶的問題;輿情監(jiān)測,分析社交媒體上公眾對某個事件或品牌的看法和情感傾向。

知識圖譜

【原理】

一個大型的知識倉庫,把以前儲備的各種問題和對應(yīng)的解決方法整理成一個數(shù)據(jù)庫,并且梳理出它們之間的關(guān)系。當(dāng)遇到類似的問題時,就可以快速在這個倉庫里找到相關(guān)的信息和解決辦法,并推薦給用戶。

【應(yīng)用場景】

電商平臺的客服機器人,如淘寶小蜜,當(dāng)用戶咨詢商品問題時,它能快速找到類似問題的答案進行回復(fù);智能搜索,在搜索某個主題時,能展示相關(guān)的知識和關(guān)聯(lián)信息。

本文由 @思睿 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!