4類GPT產(chǎn)品模式、4個(gè)GPT小項(xiàng)目、4個(gè)商業(yè)化風(fēng)險(xiǎn)——AI產(chǎn)品經(jīng)理視角

6 評(píng)論 23227 瀏覽 132 收藏 13 分鐘

本文作者從AI產(chǎn)品經(jīng)理的視角,對(duì)最近2個(gè)月學(xué)習(xí)使用ChatGPT的經(jīng)驗(yàn)進(jìn)行了總結(jié),包括4類GPT產(chǎn)品模式、4個(gè)自己做的小項(xiàng)目、4個(gè)商業(yè)化風(fēng)險(xiǎn)。感興趣的小伙伴們一起來看一下吧!

以下是從AI產(chǎn)品經(jīng)理的視角,對(duì)最近2個(gè)月學(xué)習(xí)使用ChatGPT的總結(jié),包含4類GPT產(chǎn)品模式、4個(gè)我做的小項(xiàng)目、4個(gè)商業(yè)化風(fēng)險(xiǎn)。

  • 4類GPT產(chǎn)品模式是:Prompt類、Embedding類、Fine-Tune類、LLM類
  • 4個(gè)GPT小項(xiàng)目是:內(nèi)容生成、做個(gè)小程序、Embedding類項(xiàng)目、嘗試Fine-Tune自己的GPT
  • 4個(gè)商業(yè)化風(fēng)險(xiǎn)是:GPT迭代速度太快了、數(shù)據(jù)安全問題、內(nèi)容審核、OpenAI政策問題

一、4類GPT產(chǎn)品模式

結(jié)合這段時(shí)間的項(xiàng)目經(jīng)驗(yàn),我把目前chatGPT類的產(chǎn)品化模式分為四類,由簡(jiǎn)單到復(fù)雜介紹一下。

1. Prompt類

僅使用chatGPT,這一類是最常見,也是商業(yè)化做得最多的。

核心是利用Prompt引導(dǎo)去生成內(nèi)容,比如日?qǐng)?bào)生成器、小紅書標(biāo)題生成器、英語學(xué)習(xí)等,上面這個(gè)圖片是我發(fā)現(xiàn)整理比較好的,另外也推薦下【外語易學(xué)堂】小程序,可以學(xué)習(xí)52種外語

2. Embedding類

向量數(shù)據(jù)庫 + 搜索 + chatGPT。強(qiáng)烈推薦大家重點(diǎn)看這個(gè)方向!無論是私人助理,還是智能客服,只要是結(jié)合自有知識(shí)生成回答的項(xiàng)目,都繞不開這個(gè)方案產(chǎn)品化空間很大,我自己也是花了最多時(shí)間在這個(gè)方向。

截圖是鼎鼎大名的chatPDF項(xiàng)目,技術(shù)方案大致如下:

  • 文本切割: 將自有的文檔或知識(shí),切割成一小塊一小塊的,每一塊都向量化(可以用OpenAI的Embedding接口),返回這段文本的 embedding 的向量數(shù)據(jù)。存儲(chǔ)這些數(shù)據(jù),并且保存好對(duì)應(yīng)關(guān)系。
  • 用戶提問: 將用戶提的問題也向量化,拿到問題的向量數(shù)據(jù)。
  • 搜索向量: 計(jì)算相似度。用問題的向量,在之前切割的所有向量數(shù)據(jù)里,計(jì)算和問題向量相似度最高的幾個(gè)文本,可以直接使用余弦定理。
  • 調(diào)用 ChatGPT: 將搜索到的知識(shí)和用戶提問拼在一起,加上一段準(zhǔn)備特殊的 prompt(例如:使用以上內(nèi)容回答以下問題 ),去調(diào)用ChatGPT接口,生成回復(fù)。
  1. 技術(shù)方案看起來簡(jiǎn)單明了,但在實(shí)現(xiàn)過程中也有非常非常多的細(xì)節(jié),后面會(huì)結(jié)合我自己實(shí)際操作講一下注意事項(xiàng)。

3. Fine-Tune類

不斷微調(diào),去訓(xùn)練一個(gè)專屬自己的GPT模型。比如你想做一個(gè)銷售機(jī)器人,和客戶聊天的語氣盡可能模擬金牌銷售的樣子,這個(gè)機(jī)器又能掌握公司所有產(chǎn)品的知識(shí),那你就最好自己Fine-Tune一個(gè)自己的專屬模型,因?yàn)楝F(xiàn)有的chatGPT不能做到如此的擬合你的語氣。

但這里有很大的成本問題,GPT-3的Davinci訓(xùn)練100M數(shù)據(jù)大概需要5萬塊人民幣(記不太清楚了),部署也要另外收費(fèi),成本很高,此外GPT3.5是不支持Fine-Tune的。不過Fine-Tune時(shí)候也不一定非要用Davinci,根據(jù)和Azure的溝通,他們?cè)谀承╉?xiàng)目上使用Ada做分類模型的效果也很好。我們也嘗試過Fine-Tune,過程感人,后面再說。

4. LLM類

自己從頭做一個(gè)GPT類的完全屬于自己的預(yù)訓(xùn)練大模型。這個(gè)是大公司專屬,參考百度文心一言、王慧文大佬的創(chuàng)業(yè)項(xiàng)目。不過其實(shí)考慮到Meta已經(jīng)將LLaMA開源了,小團(tuán)隊(duì)做一些非商業(yè)化的項(xiàng)目還是可以的(參考斯坦福發(fā)布的Alpaca),但是難度依然很大,不建議大家直接沖,另外就是要注意版權(quán)問題,因?yàn)槲乙矝]做過,不詳細(xì)展開了。

二、4個(gè)我做的小項(xiàng)目

1. 內(nèi)容生成

最簡(jiǎn)單最容易上手的,當(dāng)然是直接生產(chǎn)內(nèi)容啦。為了驗(yàn)證GPT的生成能力,設(shè)計(jì)了一個(gè)小實(shí)驗(yàn):利用GPT生成文案,再用剪映一鍵成片,從而實(shí)現(xiàn)批量生成視頻內(nèi)容。經(jīng)過2天的熟悉后,很快可以15分鐘內(nèi)穩(wěn)定輸出40s視頻。一周時(shí)間我制作了40條視頻,收獲xx點(diǎn)贊,x個(gè)粉絲,后面就懶得搞了,囧。

2. 自己做了一個(gè)學(xué)外語的小程序

瘋狂使用GPT嘗試不同的應(yīng)用場(chǎng)景后,我發(fā)現(xiàn)教育是非常適合GPT特性的,也特別適合個(gè)人開發(fā)者。因?yàn)殚_發(fā)比較簡(jiǎn)單,我就自己順手做了一個(gè)學(xué)習(xí)52種外語的小程序——外語易學(xué)堂,能糾正語法錯(cuò)誤,可以模擬一個(gè)私人教練一樣和你展開溝通,特別適合社恐星人,再也不用去英語角了。

3. Embedding類的項(xiàng)目

這個(gè)是我們參考chatPDF做的一個(gè)嘗試,在在實(shí)際使用時(shí)候,效果也確實(shí)很好,怎么提問都能生成合適的回答。步驟簡(jiǎn)介在上面說過了,下面我結(jié)合業(yè)務(wù)實(shí)際使用情況,分享下當(dāng)前存在的問題,包括且不限于:

  • 富文本處理:這個(gè)是最大的問題,目前公開的GPT3.5是不支持富文本識(shí)別的,比如客戶上傳一個(gè)圖片詢問如何處理,這種答案就無法回答,15日公開的GPT4暫時(shí)也沒開放圖片輸入的能力,等OpenAI發(fā)布新版本后我們會(huì)再次修改產(chǎn)品。
  • 多輪對(duì)話:這個(gè)是第二大的問題,GPT3.5支持的最大token數(shù)是4096,實(shí)際應(yīng)用中4輪左右的對(duì)話就會(huì)觸及上限了,繼續(xù)提問就會(huì)出現(xiàn)“遺漏記憶”的情況。這部分我們也和Azure的同學(xué)專題溝通過,他們也沒有什么特別好的辦法,不過好消息是GPT4的token長(zhǎng)度增大了不少,但是價(jià)格也太貴了,用不起用不起。
  • 其他:知識(shí)的時(shí)效性、知識(shí)權(quán)重、內(nèi)容過濾、Embedding的工程化問題等,細(xì)節(jié)其實(shí)很多,大家想看下次單獨(dú)起一個(gè)文章。

    4. 嘗試訓(xùn)練自己的GPT

    因?yàn)镚PT3沒開源(我們也微調(diào)不起),就想著是不是可以利用GPT2 + RLHF試著做一個(gè)特定小領(lǐng)域的chatGPT,經(jīng)過近20余人連續(xù)1周幾千次的標(biāo)記,結(jié)論是xxxx(回頭再說吧,都是辛酸淚,單標(biāo)注平臺(tái)的設(shè)計(jì)就很麻煩了)

    三、4個(gè)商業(yè)化問題

    回頭看這2個(gè)月以來的產(chǎn)品化路徑,心情是跌宕起伏的。最開始激動(dòng)不已,感覺AGI終于要到來了,但當(dāng)從商業(yè)化、產(chǎn)品化角度去考驗(yàn)GPT時(shí)候,又發(fā)現(xiàn)一堆的問題,有些沮喪,再到后來OpenAI不斷釋放最新的接口,商業(yè)化似乎又可以期待了,類似情況循環(huán)往返,現(xiàn)在終于到了比較平靜的狀態(tài),總而言之吧,前途是光明的。這里列舉一下我碰到的商業(yè)化問題。

    1. GPT迭代速度太快了

    這看起來是一個(gè)好事,但其實(shí)也是一個(gè)頭疼又幸福的煩惱。經(jīng)常是你一個(gè)商業(yè)模式剛開始做,GPT就出了新版本了,以前的東西就要重新思考。比如一開始沒有發(fā)布GPT-3.5-Turbo模型,做產(chǎn)品時(shí)候要用session的方案去模擬請(qǐng)求,后來發(fā)布了GPT3.5的API后,產(chǎn)品又要重新開發(fā)。

    又比如多模態(tài)問題,這個(gè)GPT4發(fā)布后看起來解決了一部分(要測(cè)試一下才知道),但注定又要重新設(shè)計(jì)產(chǎn)品。快速迭代的模型是好事,但至少現(xiàn)階段來看,是不利于發(fā)展成熟的商業(yè)模式的,大家不太敢大規(guī)模投入,可以參考jasperAI和Grammarly的情況。

    2. 數(shù)據(jù)安全問題

    經(jīng)過和微軟Azure的反復(fù)確認(rèn),目前OpenAI是沒有在國(guó)內(nèi)部署服務(wù)器的,也就是說你所有的請(qǐng)求內(nèi)容都要出國(guó),送到美國(guó)的服務(wù)器處理。這個(gè)大公司尤其敏感,也就注定了百度文心一言會(huì)有市場(chǎng),如果你在大公司,就要仔細(xì)考慮下了。

    3. 內(nèi)容審核

    如果要做商業(yè)化,對(duì)輸出內(nèi)容的zz審核及敏感內(nèi)容過濾是一定要注意的,建議GPT生成的內(nèi)容再過一遍審核服務(wù),避免別人爆破你的服務(wù),輸出一些不安全的內(nèi)容。

    4. OpenAI政策問題

    3月初開始,OpenAI的API地址就被墻了,需要自己想辦法。另外上周開始,OpenAI封禁了一批“非法請(qǐng)求”的賬號(hào),從國(guó)內(nèi)/香港等OpenAI不支持地區(qū)的訪問,將會(huì)被封禁賬號(hào),具體自己看OpenAI的政策。我當(dāng)時(shí)收到的郵件如下:

    四、有趣產(chǎn)品分享

    下面是幾個(gè)非常有趣的產(chǎn)品推薦,他山之石可以攻玉,朋友們看一下:

    五、參考資料

    1. 如何體驗(yàn)chatGPT

    最小白的問題其實(shí)也很重要,如果你已經(jīng)會(huì)使用GPT了,直接跳過。

    • 國(guó)內(nèi)直接用: 推薦【阿旺機(jī)器人】小程序,這個(gè)是BaixingAI公眾號(hào)開發(fā)的,使用最簡(jiǎn)單,國(guó)內(nèi)就能用。
    • OpenAI官方直接點(diǎn)這里,用起來比較麻煩。
    • API訪問: 注冊(cè)賬號(hào),拿到API key,使用https://chatx.me、OpenCat等訪問,注冊(cè)方法自己搜索吧。

    2. GPT原理學(xué)習(xí)

    有點(diǎn)基礎(chǔ)的可以直接看以下內(nèi)容,再次說明,這個(gè)是產(chǎn)品經(jīng)理視角的,算法工程師們請(qǐng)直接看論文:

    3. 幾個(gè)好的開源項(xiàng)目/論文

    • ChatGPT 中文調(diào)教指南:大量的中文調(diào)教prompt,很實(shí)用。
    • 微軟的Visual ChatGPT:連接 ChatGPT 和一系列視覺模型,以實(shí)現(xiàn)在 ChatGPT 的聊天過程中發(fā)送和接收?qǐng)D像。
    • Meta推出的Toolformer:讓LLM自己學(xué)會(huì)使用工具,在實(shí)際業(yè)務(wù)中,很多場(chǎng)景是需要機(jī)器人自己調(diào)用外部工具的,期待早日成熟。

本文由 @FakeFelix 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 您好,Embedding類 小白,求指導(dǎo)

    來自廣東 回復(fù)
  2. 您好,我搜索了很多相關(guān)信息,但是并沒有找到關(guān)于chatPDF原理的描述,請(qǐng)問您能給出一些來源嗎?根據(jù)文中的意思,應(yīng)該是chatPDF做了問題和知識(shí)庫的embedding,然后使用算法進(jìn)行匹配,最后僅僅是使用chatGPT生成符合語言邏輯的回答,是這樣嗎?

    來自美國(guó) 回復(fù)
    1. 是這樣的,GPT只是用來生成更人性化的語言。(之前的回復(fù)被站長(zhǎng)吞了)

      來自廣東 回復(fù)
  3. 111111111

    來自上海 回復(fù)
  4. 體驗(yàn)了一下外語易學(xué)堂,真心覺得爛,加載慢而且還只是文字對(duì)話而已,還以為是語音對(duì)話

    回復(fù)
    1. 啊這,我自己一個(gè)人順手做的小程序,給你免費(fèi)玩的,和氣和氣

      來自廣東 回復(fù)