產(chǎn)品經(jīng)理可能需要的AI大模型知識·大白話版
從ChatGPT到Deepseek,AI大模型的出現(xiàn)為產(chǎn)品設計帶來了無限可能,但如何將這些強大的技術(shù)融入產(chǎn)品設計中,更好地滿足用戶需求,成為產(chǎn)品經(jīng)理必須面對的問題。本文以通俗易懂的方式,為產(chǎn)品經(jīng)理介紹了AI大模型的核心知識,供大家參考。
從 ChatGPT 問世到 Deepseek 的出現(xiàn),AI 給人類帶來的驚艷已無需多言,AI 大模型的發(fā)展速度遠超過我們想象。「如何打開腦洞讓 AI 幫你做 PPT?」、「如何寫 prompt 提示詞讓 AI 顯得更專業(yè)?」,現(xiàn)在市面上并不缺乏教你如何更好使用 AI 大模型的內(nèi)容。
今天我想要和大家聊聊的是:除了這些眾所周知的,產(chǎn)品經(jīng)理還需要知道哪些 AI 大模型的知識?
1.核心問題是…?
作為非 AI 領域的產(chǎn)品經(jīng)理,可能并不需要深入了解其技術(shù)原理和運作方式,但在當前猛烈的技術(shù)浪潮下,你總有一天會遇到這樣的問題:
如何充分利用 AI 大模型,
融入自己的產(chǎn)品設計,
更好滿足用戶需求?
在此之前,你可能聽說過一些名詞,諸如微調(diào)、知識庫、Token、插件、MCP等,但知其名,不知其意。
此外,現(xiàn)在 AI 大模型也種類繁多,國外的 OpenAI、Google Gemini、Anthropic Claude、Meta Llama、xAI Grok…以及國內(nèi)的 Deepseek、阿里通義千問、月之暗面 Kimi、字節(jié)豆包、騰訊混元…
縱然亂花漸欲迷人眼,但其實大體上核心基本能力相似,分支專業(yè)領域各有所長。
作為產(chǎn)品經(jīng)理,有必要對這些能力有一些基本了解。別等到不得不擁抱AI的時候,你能想到的只有一個輸入框。
2.他們能做什么?
接下來我將要重點介紹 AI 的一些基本能力,可以幫助你更好地去定制和設計 AI,讓 AI 與你的產(chǎn)品更加契合。
希望了解這些知識后你能夠打開思路,避免千篇一律教條化 AI 接入。
2.1 結(jié)構(gòu)化輸出,讓AI學會「填表」
這個很好理解,就是讓 AI 按照規(guī)定的格式來說話,別「瞎逼逼」。
填表比說話更有效率
我們平時也經(jīng)常會「填表」,目的就是讓我們按照規(guī)定的格式來輸入信息,這樣的數(shù)據(jù)能夠更好地收集和處理。否則張三李四各說一個版本,你也搞不清楚關鍵的信息是否收集到位了。
讓大模型「填表」
對于大模型,你也可以要求 AI 用你規(guī)定的格式來回答問題。
{
“產(chǎn)品名稱”: “智能音箱”,“型號”: “X100”,
“價格”: “499”,
“庫存”: “200”,
“image”: “圖片地址”,
“url”: “鏈接地址”
}
這樣做的好處包括但不限于:
※ 規(guī)范回答格式,一定程度避免 Ta 放飛自我;
※ 方便開發(fā)工程師對數(shù)據(jù)進行二次包裝或者處理;
※ 切換不同大模型時,能獲得相對規(guī)范統(tǒng)一的回答。
隨便舉幾個應用例子:
※ 讓 AI 從用戶差評中自動提取「問題類型-嚴重程度-情緒評分」;
※ 把自由格式的會議紀要轉(zhuǎn)換成「議題-負責人-時間節(jié)點」的表格;
※ 讓大模型根據(jù)需要,回復用戶不同格式的消息:文本、圖片、視頻、跳轉(zhuǎn)鏈接等等…
小結(jié)
通過結(jié)構(gòu)化輸出,你可以進一步壓榨 AI 大模型,讓 Ta 和你想要設計的功能、想要滿足的需求更高效地結(jié)合起來,AI 不再只是偶爾嘴上跑火車的對話框了。
2.2 學會用工具,告別「光說不練假把式」
數(shù)百萬年前,人類開始學會制作和使用工具,工具的使用又反過來推動了人類的進化。
巧婦難為無米之炊
試問,在不借助任何工具的情況下,你能不能空手做好一桌大餐?
很難吧。
如果給你足夠的工具,譬如菜刀、鏟子、鍋碗瓢盆、微波爐、烤箱、榨汁機、一個可以查詢食譜的電腦…是不是事情會 easy 很多?
同樣的,一個只會對話和回答問題的 AI 都是鍵盤俠,紙上談兵罷了。但如果學會了使用工具,AI 實力將得到極大的提升。
舉例一個具體的場景,當你想要去成都旅游時,可能會問 AI 大模型一些基礎的攻略:
但如果讓 Ta 學會調(diào)用旅游相關的工具,事情就會變得有意思:
※ 查一查成都最近的天氣是否適合旅游;
※ 幫你訂好到成都的機票;
※ 查詢飛機降落的信息,及時提醒在哪里取行李;
※ 幫你預約好接機的網(wǎng)約車;
※ 幫你預訂好合適的酒店;
※ 幫你預定好每一天的行程、博物館的門票、用餐的餐廳等等;
※ 每到一個地方,都按照你的興趣為你講解;
……
簡單來講,你是可以教會 AI 怎么去使用你提供的工具的,基本的形式是:
※ 先告訴大模型 Ta 可以使用哪些工具,這些工具分別是干什么的,怎么用;
※ 當你向 AI 提出一個需求時,Ta 會自己判斷是直接回答還是調(diào)用合適的工具來幫你完成任務;
※ AI 會按照工具的使用說明書,自動生成調(diào)用指令,向工具發(fā)出請求;
※ 工具處理完請求后,返回結(jié)果,AI 再將結(jié)果整理、優(yōu)化并反饋給你。
目前,工具調(diào)用常見的概念有兩個:單個工具調(diào)用(Function Calling) 和 工具包調(diào)用(MCP)。
Function Calling
大多主流大模型都提供了 Function Calling 的能力,你可以提供很多個 Function 給大模型使用,每個 Function 實現(xiàn)不同的功能。
這就像工具箱里一個個不同用途的工具:螺絲刀、鉗子、錘子、扳手、鋸子…每個工具都有不同用途。大模型會根據(jù)對話需求,自行決定是否調(diào)用工具以及調(diào)用什么工具。
需要注意的是,這些工具需要你親手做好,并寫好說明書教大模型如何使用。雖然大差不大,但每個大模型對 Function Calling 規(guī)則和標準不盡相同,當你切換不同大模型時,可能需要針對性「私人定制」一下。
MCP
相比 Function Calling,MCP 則更像是一個個打包好的、不同用途的工具箱,譬如剛才提到的螺絲刀、鉗子、錘子、扳手、鋸子…就可以打包成一個「維修工具包」。
除此之外,我們還可以把創(chuàng)口貼、紗布、棉花、剪刀、碘伏等打包成一個「醫(yī)療急救包」。
同樣的,把指甲刀、銼刀、修眉刀、挖耳勺等集合到一起,又可以成為一個「日常護理包」。
沒錯,你可以把 MCP 看做是一個標準化的、解決不同領域問題的「集合工具包」,Ta 把某一領域需要用到的功能都打包在了一起,并且用標準化的協(xié)議來連接大模型。這樣一來,不同的大模型都能夠統(tǒng)一地使用工具包里的每一個工具.
MCP(Model Context Protocol,模型上下文協(xié)議)是由 Anthropic 公司推出的開放標準協(xié)議,目前這個技術(shù)標準還在發(fā)展當中,更加復雜的技術(shù)概念就不在這里贅述了,感興趣的朋友可以搜索更多資訊進一步了解。
二者對比
多模態(tài):給AI嘴巴、眼睛和耳朵
除了傳統(tǒng)的文本對話和工具調(diào)用之外,現(xiàn)代 AI 大模型正逐步具備強大的多模態(tài)能力。這意味著,AI 不僅能“說”,還能“看”圖像、聽語音,甚至處理視頻內(nèi)容,從而為產(chǎn)品帶來更多維度的交互體驗。
具體來說,多模態(tài)能力體現(xiàn)在以下方面: ※ 視覺識別與生成 能看圖,也能畫圖。AI 可以看懂圖片,也可以根據(jù)描述自動生成符合風格的圖片素材。 ※ 語音識別與合成 聽人話,說人話。AI 能聽懂用戶說的話,也能夠通過語音回應用戶。 ※ 視頻內(nèi)容解析 看視頻,做視頻。AI 能看懂視頻的內(nèi)容,并且有自己的理解。與此同時,AI 也在逐步具備生成視頻的能力,仍在發(fā)展中。
通過多模態(tài)交互,你可以讓 AI 大模型變得更加“全能”,不僅限于文字對話,而是通過視覺、聽覺等多個感官渠道與用戶互動,為產(chǎn)品創(chuàng)新提供更多可能。
AI Agent
最近到處都在講的 AI Agent,就是把這些能力整合在一起,通過感知、決策和使用工具,成為一個能自主思考并完成任務的智能助手。
小結(jié)
你可以把你產(chǎn)品的各種能力按需包裝成「工具」或者「工具包」,AI 不止會「說」,還能真正去「做」。 此外,可按需接入多模態(tài)能力,賦予 AI「看」、「聽」、「說」的能力。 這樣一來,AI 同你產(chǎn)品的結(jié)合度會更加緊密,也可以更好地滿足用戶的需求。
2.3 PUA大模型,教Ta做事
大模型什么都懂,但 Ta 不一定懂你。那怎么讓大模型知你懂你、按照你想要的方式和答案去回答用戶呢?
請掌握好兩大「PUA」大法:模型微調(diào)(Fine-tuning) 和 檢索增強生成(RAG)。
說人話就是:喂飯 和 給辭典。
給AI喂飯:模型微調(diào)(Fine-tuning)
俗話說,熟讀唐詩三百首,不會作詩也會吟。如果你對 AI 針對某些問題的回答不夠滿意,就可以用填鴨式教學的方式不停地給 Ta 舉例子,讓 Ta 逐步變成你想要的模樣。
通過「喂飯」,可以把一個通用大模型轉(zhuǎn)化為「醫(yī)療問答專家」,或者一個「中二少年」。需要注意的是,雖然這里叫「微調(diào)」,但 AI 的「飯量」很大,你需要提供足夠多的數(shù)據(jù),Ta 才能夠有更加穩(wěn)定可靠、符合期望的表現(xiàn)。
給AI辭典:檢索增強生成(RAG)
在不借助互聯(lián)網(wǎng)的情況下,如果你要搞懂「樽俎折沖」這個成語的含義,你會怎么辦?
查辭典是一個比較高效的辦法。
同樣的,如果想要 AI 專精一些冷門或?qū)I(yè)性知識,譬如客服回復話術(shù)或產(chǎn)品使用說明。
那就可以丟給 Ta 一個知識庫文檔,AI 會自己去檢索文檔內(nèi)容,結(jié)合文檔的知識來回答用戶問題。
值得一提的是,這里 AI 使用的不是我們傳統(tǒng)的「關鍵詞搜索」,而是「語義檢索」。
平時我們搜索一個文檔,「番茄」就是「番茄」,「西紅柿」就是「西紅柿」,你搜索「番茄」是找不到「西紅柿」的。
而語義檢索可以做到搜索「番茄」也找到「西紅柿」。這讓 AI 對知識庫的檢索能力變得比人更強大。
二者對比
小結(jié)
你可以把一些產(chǎn)品特有的知識教給 AI,這樣 AI 就可以變成你期待的樣子。
2.4 和AI對話,一場人格分裂的角色扮演
首先,眾所周知,AI能對話。
除了在Ta們提供的聊天框內(nèi)與他們對話,你還可以調(diào)用 API(開放接口)能力,與 Ta 對話。
# 每一次消息都要帶上之前說過的話,不然AI不知道之前說了啥。
messages = [
{
“role”: “system”,
“name”: “唐詩專家”,
“content”: (
“你是一位唐朝詩人助手,能夠根據(jù)上下文扮演不同的唐代詩人。”
“請確保所有回答都融合唐朝詩人的文風。”
“根據(jù)用戶要求,分別模擬李白和杜甫的風格:”
“李白應表現(xiàn)豪邁奔放,而杜甫應表現(xiàn)沉穩(wěn)細膩。”
)
},
{
“role”: “user”,
“name”: “王工”,
“content”: “李白,請你描繪一下秋天的景色。”
},
{
“role”: “assistant”,
“name”: “李白”,
“content”: (
“秋風蕭瑟,落葉紛飛;云海蒼茫中,激起我心中無限豪情。”
)
},
{
“role”: “user”,
“name”: “用戶”,
“content”: “杜甫,請你點評李白的這段描寫。”
},
{
“role”: “assistant”,
“name”: “杜甫”,
“content”: (
“李白兄之詞,雖豪邁奔放,但略顯輕佻;秋景雖美,情思更需沉穩(wěn)細膩。”
)
},
{
“role”: “user”,
“name”: “劉總”,
“content”: “李商隱你來評價一下李白和杜甫。”
},
]
# 調(diào)用接口,把包括新對話的聊天記錄傳過去response = openai.ChatCompletion.create(
model=”gpt-3.5-turbo”,
messages=messages
)
# 收到回復,打印出來看看print(response.choices[0].message[‘content’])
看不懂沒關系,也不需要太懂,我舉個例子來逐一解釋。
想象甲乙丙三方公司通過郵件進行溝通:
① role(角色)
角色即身份,有點類似郵箱@后的域名,你來自哪個公司一眼就看出來了。對于 AI 來說,主要有 3 種身份:
※ system(系統(tǒng))
類似于第三方監(jiān)管機構(gòu),郵箱地址:xxx@system.com。主要負責制定一些基本規(guī)則,教乙方做事,讓乙方在甲方面前老實點,別放飛自我整幺蛾子。
※ user(用戶) 至高無上、提出需求的甲方,郵箱地址:xxx@user.com。甲方說啥就是啥,有啥問題都隨意提。甲方可以是一個人,也可以是多個人。
※ assistant(助手)
這里就是指 AI 大模型,兢兢業(yè)業(yè)滿足需求的乙方,郵箱地址:xxx@assistant.com。甲方說啥就是啥,乙方必須有求必應。同樣的,乙方也可以是一個「人」或多個「人」。
② name(名字)
有點類似郵箱@前面的賬號名,你是甲方的誰誰誰或者乙方的誰誰誰就分得很清楚了:
※ 唐詩專家指導@system.com
※ 劉總@user.com、王工@user.com
※ AI李白@assistant.com
※ AI杜甫@assistant.com
※ AI李商隱@assistant.com
一般來說,我們不會默認使用 name,因為 role 的三種角色已經(jīng)足夠了。但如果你構(gòu)思的產(chǎn)品需要有多用戶和多角色的時候(譬如人機混戰(zhàn)劇本殺),那么 name 就能派上用場。
③ content(內(nèi)容)
顧名思義,寫郵件的時候肯定會包含郵件正文,甲乙丙三方都通過郵件正文傳遞信息。
④ forgetful(健忘)
每封郵件必須包含之前所有的對話歷史。
很不幸,這個郵箱對話系統(tǒng)非常簡陋,每次只能看當前收到的郵件內(nèi)容,不存檔之前說過什么,甲乙丙也都是「金魚腦」,什么都不記得。
因此,為了讓大家明白來龍和去脈,每一次發(fā)郵件的時候,都需要帶上之前所有的對話。只有這樣,AI 才能明白之前討論過哪些問題,進而做出連貫、準確的回答。
但這樣也帶來兩個硬傷:
※ AI 對話的記憶有限,遲早會失憶;
※ 對話輪次越多,消耗的 token(RMB??) 也呈指數(shù)級增長。
小結(jié)
了解以上的信息之后,結(jié)合不同的 system、user、assistant,相信你已經(jīng)有了很多新的想法和創(chuàng)意。
2.5 更多小知識
作為甲方的你,除了可以和大模型對話,還可以提一些小要求。
我就簡單說幾個大家可能常用的:
stream:流式輸出
可以控制 AI 的回答是全部就緒了一次性發(fā)給你,還是一個字一個字蹦給你。是的,我們平時看大模型回答一直在打字,就是用的流式傳輸。由于大模型輸出完整答案的時間目前還比較長,流式輸出可以有效減少用戶的等待焦慮。
frequency_penalty:重復率
-2 到 2 的一個數(shù)字,減少重復內(nèi)容,避免復讀機。如果 frequency_penalty>0,AI 回答問題一旦出現(xiàn)已有文本中就會被扣工資。
temperature:溫度
雖然叫溫度,但其實代表著 AI 的隨機性、創(chuàng)造性。溫度低,AI 就比較穩(wěn)扎穩(wěn)打,對同樣問題盡可能保持一致回答,反之思維則更加發(fā)散、回答的隨機性更多。還有一個參數(shù)叫 top_p,作用類似就不贅述了,免得把你繞暈了。
小結(jié)
如果你還想知道更多關于大模型的參數(shù),你可以去查看各個大模型官網(wǎng)的 API 文檔,里面有更加詳細的說明。
3.AI的幻覺
AI 幻覺,簡單來說就是 AI「一本正經(jīng)地胡說八道」,Ta 有時候會給出看似邏輯通順、有鼻子有眼,但實際上不符合事實、和你問題八竿子打不著的回答。
這是因為:
※ 瞎讀書,讀瞎書:
訓練數(shù)據(jù)中包含了太多錯誤的、質(zhì)量不高的信息,走火入魔、誤入歧途了;
※ 想太多,太多想:
AI 會強行關聯(lián)高頻出現(xiàn)的詞匯(比如:看到「加拿大」就想「多倫多」,但你的問題其實是加拿大首都在哪里);
※ 好面子,怕冷場:
現(xiàn)在的大模型更多被設計成“寧可死鴨子嘴硬瞎編也不承認自己不知道”,遇到拿不準的就會一本正經(jīng)的胡說八道。
所以,除非你是專門做 AI 類的產(chǎn)品,否則最好讓 AI 成為你產(chǎn)品功能的「拓展」,而不是「替代」。
畢竟,AI 不是隨時都靠譜。
4.他們分別擅長什么?
主流大模型就像武俠世界的各路高手,有的內(nèi)力深厚適合硬剛代碼,有的輕功了得擅長處理萬字長文,有的暗器精妙專攻多模態(tài)花活。結(jié)合你的產(chǎn)品需求選對兵器,才能讓 AI 真正成為你的「六脈神劍」。
以下是國內(nèi)外部分主流大模型的對比(表格較大,PC查看效果更佳):
以上的總結(jié)不一定準確,大家還是以各大模型官網(wǎng)和權(quán)威測評為準。
5.寫在最后
大模型不是萬能藥,它更像是產(chǎn)品創(chuàng)新的「催化劑」。理解能力邊界,善用工具組合,才能讓 AI 真正成為用戶的「超級助手」。
一個比較個人主觀的想法:
產(chǎn)品經(jīng)理的核心任務,
是用AI放大用戶價值,
而非追逐技術(shù)炫技。
很慶幸見證這個 AI 飛速發(fā)展的時代,也正因為如此,AI 相關的技術(shù)日新月異。這篇文章也僅僅介紹了一些稍有拓展的基本概念。如果你對 AI 感興趣,不妨在閑暇時多關注一些。
歷史的車輪仍在向前,焦慮不如期待。
本文由 @格式刷JJW 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務
- 目前還沒評論,等你發(fā)揮!