揭秘:如何尋找、設(shè)計(jì)大模型產(chǎn)品并落地發(fā)布?

6 評(píng)論 5585 瀏覽 84 收藏 18 分鐘

AI技術(shù)的進(jìn)步,給人們的工作場(chǎng)景帶來了很大變化,越來越多企業(yè)開始嘗試將AI技術(shù)融入到業(yè)務(wù)中,許多AI產(chǎn)品也應(yīng)運(yùn)而生。那么,產(chǎn)品經(jīng)理要怎么尋找到可以和AI結(jié)合的場(chǎng)景?這篇文這里,作者介紹了大模型產(chǎn)品從0到1的落地經(jīng)驗(yàn),一起來看。

從2月份 OpenAI 發(fā)布以來,AI 已經(jīng)席卷了各個(gè)應(yīng)用場(chǎng)景,工作和生活。我們可以看到市場(chǎng)上越來越多的產(chǎn)品在 AI 化,有報(bào)告顯示 76% 的 SaaS 公司正在使用或者測(cè)試將 AI 融入到他們業(yè)務(wù)中。22% 企業(yè)正在考慮如何將 AI 和業(yè)務(wù)場(chǎng)景結(jié)合,進(jìn)行下一步的 AI 迭代升級(jí)。以前做不到的場(chǎng)景能力現(xiàn)在也變得可行。

此外,市場(chǎng)上很多 AI/AIGC 產(chǎn)品經(jīng)理崗位的需求,也旺盛了起來。

這一整個(gè)行業(yè)的技術(shù)變革對(duì)創(chuàng)業(yè)者和產(chǎn)品經(jīng)理都提出了一個(gè)重要挑戰(zhàn):

  • 你的業(yè)務(wù)/產(chǎn)品和 AI 之間有什么關(guān)系?
  • 如何設(shè)計(jì)出你的下一代 AI 產(chǎn)品?

從市場(chǎng)目前的應(yīng)用數(shù)據(jù)量來看,市場(chǎng)目前并不是“只在找釘子,而找不到應(yīng)用場(chǎng)景”的階段。也不是“AI 不只是在第一階段,還沒法證明價(jià)值”。根據(jù)麥肯錫的報(bào)告,已經(jīng)有非常多的企業(yè)和產(chǎn)品落地 AI 應(yīng)用。

不過這并不意味著 AI 的整合應(yīng)用,一切都已經(jīng)成熟。

Alex Singla 指出:

要邁出下一步,讓生成式人工智能從實(shí)驗(yàn)變成業(yè)務(wù)引擎,并確保獲得豐厚的投資回報(bào),企業(yè)需要解決一系列廣泛的問題。這些問題包括:確定組織內(nèi)生成式人工智能的具體機(jī)會(huì)、治理和運(yùn)營(yíng)模式應(yīng)該是什么、如何最好地管理第三方(如云和大型語言模型提供商)、管理各種風(fēng)險(xiǎn)需要什么、了解對(duì)人員和技術(shù)堆棧的影響,以及清楚如何在銀行近期收益和發(fā)展規(guī)模所需的長(zhǎng)期基礎(chǔ)之間找到平衡。這些都是復(fù)雜的問題,但卻是釋放真正巨大價(jià)值的關(guān)鍵所在。

作為 AIGC 產(chǎn)品經(jīng)理,今天給大家介紹一下整體大模型從 0 到 1 的落地經(jīng)驗(yàn)。分為:

  1. 怎么找到可以和 AI 結(jié)合的場(chǎng)景
  2. 如何做 AI 的可行性驗(yàn)證
  3. 算賬,引入AI 后,企業(yè)掙不掙錢
  4. 尋找潛在客戶 POC(proof of concept) 演示
  5. 落地應(yīng)用并規(guī)?;?/li>

這 1-5 步想要跑得快,就需要有人熟悉 AI 大模型 + 垂直用戶場(chǎng)景。所以對(duì)產(chǎn)品經(jīng)理和企業(yè) CEO 來說,也提出了新的挑戰(zhàn)。

一、怎么找場(chǎng)景

這一步是產(chǎn)品基本功,我們需要朝外看,先看行業(yè)的用戶,需要完成哪些任務(wù),核心痛點(diǎn)是什么。這里面哪些可以使用 AI 大模型技術(shù)能完成。

創(chuàng)新之父克里斯坦森有一個(gè)「任務(wù)理論」,他介紹了這么一個(gè)經(jīng)典例子:

20 世紀(jì) 90 年代中期,底特律的兩位顧問造訪克萊頓·克里斯坦森教授在哈佛商學(xué)院的辦公室,深入學(xué)習(xí)顛覆性創(chuàng)新理論。鮑勃·莫埃斯塔和他當(dāng)時(shí)的合伙人瑞克·佩迪正在發(fā)展一項(xiàng)利基業(yè)務(wù),為面包店和零食公司提供建議。

莫埃斯塔分享了為一個(gè)快餐連鎖品牌打造的方案:販賣更多的奶昔。這家連鎖公司花了數(shù)月,極盡細(xì)致地研究這個(gè)問題。幾個(gè)月后,營(yíng)銷人員付出了很多努力,奶昔的銷量卻一點(diǎn)兒變化也沒有。

因此,教授教他們從另外一種角度來思考問題:這些消費(fèi)者的生活中出現(xiàn)什么樣的任務(wù),才會(huì)促使他們來到這家餐廳“雇用”奶昔呢?

以這個(gè)視角為出發(fā)點(diǎn),營(yíng)銷團(tuán)隊(duì)選了一天,在餐廳里站了18個(gè)小時(shí)來觀察顧客:人們是在何時(shí)購(gòu)買奶昔的?他們穿著什么樣的衣服?是獨(dú)自一人嗎?除了奶昔之外,他們還會(huì)買其他食品嗎?他們是在餐廳里把奶昔喝完,還是開車帶走呢?

原來,很大一批奶昔是在上午9點(diǎn)之前賣出的,買者則是獨(dú)身來到快餐店的人。這些人大多只會(huì)購(gòu)買一杯奶昔,他們不會(huì)待在餐廳把奶昔喝完,而是鉆進(jìn)自己的車?yán)镩_車帶走。因?yàn)榍逶绲南M(fèi)者都有一項(xiàng)需要完成的任務(wù):他們不得不百無聊賴地花很長(zhǎng)時(shí)間開車上班,因此想要用什么東西讓旅途變得有趣一些。

原來,這項(xiàng)任務(wù)的競(jìng)爭(zhēng)者有許多,但沒有一位能把任務(wù)完成得無懈可擊。有的消費(fèi)者雇用香蕉來完成任務(wù),但香蕉幾口就吃完了。還有的消費(fèi)者購(gòu)買了甜甜圈,但是面包屑太多,讓他們手指變得黏黏的,弄臟衣服和方向盤。貝果面包則又干又沒味,讓開車的人不得不一邊用膝蓋轉(zhuǎn)方向盤,一邊往面包上涂抹奶酪和果醬。還有人購(gòu)買士力架。但他覺得,早餐就吃甜點(diǎn)實(shí)在太罪惡了,所以再也沒有這樣做過?!钡悄涛裟兀克梢运闶侵T多選項(xiàng)中的最優(yōu)項(xiàng)。用纖細(xì)的吸管喝完一杯濃稠的奶昔需要花很長(zhǎng)時(shí)間,而且奶昔還能幫助抵擋上午10點(diǎn)左右襲來的饑餓。

由此可見,這種奶昔能比其他競(jìng)爭(zhēng)者更好地滿足需求。在消費(fèi)者的眼里,其他競(jìng)爭(zhēng)者不僅包括其他連鎖店的奶昔,還包含香蕉、貝果、甜甜圈、早餐棒、思慕雪和咖啡等。

研究團(tuán)隊(duì)還發(fā)現(xiàn):這些奶昔和消費(fèi)者之間的共同點(diǎn)與他們的個(gè)人狀況沒什么關(guān)系,這些消費(fèi)者的共同點(diǎn)是他們必須要在早上完成一項(xiàng)任務(wù)。

每個(gè)人的日常生活中都會(huì)出現(xiàn)需要完成的任務(wù),這個(gè)時(shí)候,我們便會(huì)雇用產(chǎn)品或服務(wù)來完成。

此外,從任務(wù)的視角去理解用戶,你會(huì)發(fā)現(xiàn)什么才是你真正的競(jìng)爭(zhēng)對(duì)手。你關(guān)注的其實(shí)更應(yīng)該是客戶在解決任務(wù)中的替代方案,而不是你以為的對(duì)手。

「任務(wù)」的定義

那到底什么是用戶需要完成的任務(wù)呢,其定義是指:

  • 一項(xiàng)任務(wù)是指?jìng)€(gè)人在特定背景下想要實(shí)現(xiàn)的進(jìn)步。
  • 成功的創(chuàng)新可使用戶取得理想的進(jìn)步、解決困難、實(shí)現(xiàn)未完成的夢(mèng)想。這些創(chuàng)新可以完成缺少有效解決方法或不存在解決方法的任務(wù)。
  • 任務(wù)絕不僅僅涉及功能,社會(huì)和情感因素也占有很大比例,而這兩者,有時(shí)甚至要比功能因素更重要。
  • 任務(wù)是在日常生活中出現(xiàn)的,因此背景對(duì)于其定義至關(guān)重要,這也是創(chuàng)新任務(wù)中不可或缺的一個(gè)環(huán)節(jié)。用戶特征、產(chǎn)品特征、新科技和流行趨勢(shì),這些都不是創(chuàng)新任務(wù)的關(guān)鍵環(huán)節(jié)。
  • 需要完成的任務(wù)是不斷發(fā)展和重復(fù)出現(xiàn)的,幾乎不可能是獨(dú)立存在的“事件”。

任務(wù)比「需求」的概念要清晰,容易定義很多。因?yàn)樾枨笫悄:?、寬泛、且無處不在的。

你可以列出你的行業(yè)場(chǎng)景中,目標(biāo)用戶需要完成哪些任務(wù),然后進(jìn)行挑選,優(yōu)先尋找 quick win(快速贏) 的解決方案。quick win 的特征是:

  • 博弈方少,項(xiàng)目阻力小。
  • 大家普遍吐槽不愿意做的事情。
  • 可以短平快的切入,客戶快速感知價(jià)值。
  • 你能夠悄悄地贏,同時(shí)也意味著你可以悄悄地輸(可選,這點(diǎn)取決于對(duì)事情成功率的把握)。

還有一種做法,是看現(xiàn)在 AI 產(chǎn)品/競(jìng)品集成場(chǎng)景有哪些,哪些是可以遷移復(fù)制到自己的業(yè)務(wù)中的。不過這種類型的遷移,有可能是一片競(jìng)爭(zhēng)血戰(zhàn),因?yàn)榇蠹叶伎吹玫健?/strong>比如電商場(chǎng)景里的聊天對(duì)話。對(duì)于產(chǎn)品來說,切入點(diǎn)很重要,大家可以多思考還有哪些場(chǎng)景可以和 AI 做整合(可以輕松地悶聲發(fā)財(cái))。

二、大模型可行性驗(yàn)證

有了場(chǎng)景后,接下來需要你對(duì)大模型基本原理有一定的了解和大致判斷,哪些場(chǎng)景任務(wù)是有可行性的。準(zhǔn)備一些測(cè)試數(shù)據(jù),選擇一個(gè)大模型平臺(tái)進(jìn)行實(shí)驗(yàn),可以是百川、OpenAI,或者微軟 OpenAI。

以下以微軟 OpenAI 能力舉例,拋磚引玉。實(shí)驗(yàn)主要分為三個(gè)部分進(jìn)行實(shí)驗(yàn):

  1. 寫 Prompt —→ 此步驟是最重要的(如果效果不理想,那么就增加 example)。
  2. 調(diào)節(jié)參數(shù),主要考慮穩(wěn)定性和模型最大 token 數(shù)量。
  3. 輸入測(cè)試數(shù)據(jù),查看對(duì)話效果,并且不斷調(diào)整 1 和 2 步。

最終基于可行性實(shí)驗(yàn),需要驗(yàn)證的是:

  1. AI 在此場(chǎng)景下是否能夠解決問題。
  2. 需要什么版本的大模型能較好地解決你客戶的問題,(因?yàn)槟P统杀緯?huì)非常不一樣)。
  3. 效果是否滿意。
  4. 效果是否穩(wěn)定。

通過找場(chǎng)景 + AI 平臺(tái)驗(yàn)證,現(xiàn)在你已經(jīng)知道了哪些場(chǎng)景有明顯優(yōu)勢(shì),哪些在 AI 的技術(shù)下仍然不夠成熟?;谏厦鎴?chǎng)景的特征,可以挑選出可行的場(chǎng)景。

三、算筆賬,AI 業(yè)務(wù)到底掙不掙錢

接下來就是業(yè)務(wù)場(chǎng)景的 ROI 了,俗稱算筆賬。

你的這個(gè)場(chǎng)景到底在 AI 的加持下,掙不掙錢。因?yàn)榇竽P偷?API 調(diào)用是線性增長(zhǎng)的,你調(diào)用的越多,你的成本越貴。

下圖是微軟 Azure OpenAI 的收費(fèi)模式,根據(jù)你實(shí)際調(diào)用的 token 數(shù)進(jìn)行收費(fèi)。其中 Prompt 指的是向模型輸入的 token 數(shù)量;Completion 指的是模型輸出的 token 數(shù)量。token 數(shù)量多少在 Azure 上會(huì)列出,所以不用擔(dān)心不知道怎么計(jì)算 token。

如果你的場(chǎng)景里面,單次調(diào)用的成本要壓在 0.0015刀以內(nèi),那么你的這個(gè)場(chǎng)景肯定是不掙錢,也不適合大模型的。我們需要在回歸到第一步里面,找到用戶花代價(jià)較大的場(chǎng)景價(jià)值中,用大模型實(shí)驗(yàn)。

因?yàn)樵诔杀镜挠?jì)算中,你需要考慮,現(xiàn)在用戶花多少代價(jià)解決這個(gè)問題,你能幫助他減少多少。減少的這部分,你能收多少錢,能否覆蓋大模型的成本費(fèi)用(如云成本)和你的開發(fā)費(fèi)用。

算賬成本可以分為:

  • 大模型成本;
  • 云成本,一般分為存儲(chǔ)成本,帶寬成本,機(jī)器成本(如 GPU)等;
  • 三方服務(wù) API 調(diào)用成本;
  • 人工 QA 成本(AI 一般少不了這部分,不然你無法做準(zhǔn)確率的驗(yàn)證);
  • 研發(fā)開發(fā)成本。

四、如何評(píng)價(jià) AI 的工作,響應(yīng)速度、準(zhǔn)確率、穩(wěn)定性?

通過以上實(shí)驗(yàn),你已經(jīng)可以知道 AI 的能力。但是怎么去評(píng)估 AI 的工作,響應(yīng)速度、準(zhǔn)確性、穩(wěn)定性、魯棒性,需要多少數(shù)據(jù)集進(jìn)行驗(yàn)證?這就是接下來如何把 AI 工作量化和下一步規(guī)模化的時(shí)候需要關(guān)心的部分。

上圖是艾瑞咨詢列出得大模型服務(wù)能力評(píng)估體系。非常的全面。不過我們實(shí)際在使用的過程中,不會(huì)這么使用。右側(cè)其實(shí)是產(chǎn)品怎么去找場(chǎng)景、價(jià)值;左側(cè)目前業(yè)界常用的 AI 也是準(zhǔn)確率(可以進(jìn)一步拆分為 Precision 和 Recall。你可以通過構(gòu)建一些測(cè)試數(shù)據(jù)集,來驗(yàn)證你的場(chǎng)景在 AI 大模型下的準(zhǔn)確率。這里會(huì)需要進(jìn)行人工驗(yàn)證。

五、完成產(chǎn)品 MVP 和工程化工作

完成了場(chǎng)景的可行性驗(yàn)證,接下來我們需要考慮產(chǎn)品化。有人會(huì)問:“如何設(shè)計(jì) AI 原生體驗(yàn)產(chǎn)品?”“AI 是一個(gè) feature 還是一款產(chǎn)品?“

這其實(shí)很好回答,回到你的用戶故事中去。在用戶需要完成某個(gè)任務(wù)的場(chǎng)景中,用戶是怎么解決他的問題的,他的流程是怎么樣的。流程里面你的業(yè)務(wù)/產(chǎn)品扮演什么角色,是一個(gè)端到端的解決方案,還是里面某個(gè)環(huán)節(jié)部分,如何融入到客戶的用戶故事中去,是一個(gè) App/Web/API?

AI 的應(yīng)用設(shè)計(jì),產(chǎn)品經(jīng)理需要著重考慮三個(gè)方面:

  • 客戶體驗(yàn):AI 的用戶體驗(yàn)和及時(shí)反饋常做的不好,用戶是否有及時(shí)反饋
  • 規(guī)?;耗壳按竽P偷恼{(diào)用有 Rate limit 限制。一個(gè)Region GPT-4,8k token 的服務(wù)調(diào)用限制是20K/min。你需要考慮如果你有海量的數(shù)據(jù)和用戶,需要怎么解決 Rate limit 限制
  • 數(shù)據(jù)隱私和安全:做企業(yè) SaaS 服務(wù)的基本繞不開數(shù)據(jù)隱私的話題,業(yè)界比較好的案例可以參考 Notion 和微軟 Azure 的安全能力,基于各個(gè)企業(yè)自己的安全機(jī)制來處理此部分。

https://www.notion.so/help/notion-ai-security-practices

接下來根據(jù)這些關(guān)鍵信息,去全局地設(shè)計(jì)的產(chǎn)品。又回歸到傳統(tǒng)的產(chǎn)品設(shè)計(jì)了。

AI 是一次技術(shù)的升級(jí),它可能全部顛覆以前傳統(tǒng)的方法,也可能是傳統(tǒng)方法的加持。但是不管如何,對(duì)于產(chǎn)品經(jīng)理來說,整體的設(shè)計(jì)流程并沒有改變。但是里面多了一個(gè)重要變量:AI。

此外,大家如果做大模型項(xiàng)目/應(yīng)用的時(shí)候需要注意,如果 AI 整合進(jìn)業(yè)后務(wù),有可能會(huì)去顛覆一個(gè)行業(yè)。作為產(chǎn)品經(jīng)理和創(chuàng)業(yè)者,除了產(chǎn)品方案本身,其實(shí)我們還要考慮很多對(duì)行業(yè)、對(duì)企業(yè)組織運(yùn)營(yíng)的影響。推薦大家閱讀本專欄相關(guān)創(chuàng)新的文章。

為我投票

我在參加人人都是產(chǎn)品經(jīng)理2023年度評(píng)選,希望喜歡我的文章的朋友都能來支持我一下~

點(diǎn)擊下方鏈接進(jìn)入我的個(gè)人參選頁(yè)面,點(diǎn)擊紅心即可為我投票。

每人每天最多可投30票,投票即可獲得抽獎(jiǎng)機(jī)會(huì),抽取書籍、人人都是產(chǎn)品經(jīng)理紀(jì)念周邊&起點(diǎn)課堂會(huì)員等好禮哦!

投票傳送門:https://996.pm/YNx1o

專欄作家

圈圈,微信公眾號(hào):lovepm,人人都是產(chǎn)品經(jīng)理專欄作家,專注與熱愛產(chǎn)品工作。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 能否再講講,當(dāng)前AI在不同領(lǐng)域,或在您深耕的領(lǐng)域內(nèi),都是在什么場(chǎng)景下集成了AI呢?

    來自北京 回復(fù)
  2. 寫的非常專業(yè)!

    來自浙江 回復(fù)
  3. 很棒的科普文

    來自廣東 回復(fù)
  4. 好文!

    來自日本 回復(fù)
  5. 很贊的文章!

    來自上海 回復(fù)
    1. 謝謝喜歡,也可以關(guān)注公眾號(hào),一起進(jìn)群溝通大模型哦

      來自上海 回復(fù)