輕松搭建AI應(yīng)用的三個(gè)大模型技術(shù)路線(xiàn)

0 評(píng)論 4555 瀏覽 7 收藏 8 分鐘

如今,談起AI,已經(jīng)能夠想到我們?nèi)粘9ぷ骱蜕畹挠绊懥恕I+應(yīng)用用于提高我們的工作效率,那么要搭建這樣的AI應(yīng)用需要什么技術(shù)?本文將從技術(shù)介紹,適用邊界,操作步驟和應(yīng)用示例來(lái)聊聊三個(gè)大模型技術(shù)路線(xiàn),一起來(lái)看看吧。

時(shí)下聊起AI,想必最熱的就是使用AI+的應(yīng)用(chatGPT,文心一言等)來(lái)提升自己工作的效率,比如破局俱樂(lè)部,洋哥帶領(lǐng)星球2萬(wàn)多人開(kāi)啟大航海,教人使用這一波新起的應(yīng)用進(jìn)行賺錢(qián)與賦能。

在我的視角來(lái)看,當(dāng)下仍然是前期的紅利,現(xiàn)在這趟車(chē)就像是凌晨的“高鐵檢測(cè)車(chē)”,是先行軍,估計(jì)在2024年才會(huì)迎來(lái)真正的爆發(fā)。

今天的話(huà)題,就相當(dāng)于大模型應(yīng)用大爆發(fā)前的“閃電”,我們將從技術(shù)介紹,適用邊界,操作步驟和應(yīng)用示例來(lái)聊聊三個(gè)大模型技術(shù)路線(xiàn),幫助你開(kāi)闊它背后的秘密:

  1. 指令工程技術(shù)
  2. 表示學(xué)習(xí)和檢索技術(shù)
  3. Fine-tune(微調(diào))技術(shù)

01?指令工程技術(shù)

談起指令工程,用過(guò)chatGPT,文心一言等等對(duì)話(huà)式AI應(yīng)用的你并不陌生,就是通過(guò)輸入prompt指令,來(lái)達(dá)到輸出你想要的文字,圖片或者視頻。

更專(zhuān)業(yè)的大廠(chǎng)在去年6月爆發(fā)式的招收過(guò)一批prompt engineer,他們的作用就是不斷的調(diào)整指令來(lái)搭建不同的領(lǐng)域型應(yīng)用。比如AI心理醫(yī)生,AI聊天助手等等。

當(dāng)時(shí)我搭建過(guò)一個(gè)AI蘇格拉底,聊起來(lái)頗有壓力。但聊著聊著就我就發(fā)現(xiàn)它不知道自己是誰(shuí)了,這也是這種技術(shù)的限制。

技術(shù)難度:????

適用邊界:適用于可以被簡(jiǎn)潔指令描述的任務(wù),如內(nèi)容創(chuàng)作(文章、故事、代碼)、問(wèn)題解答、推理分析等。

實(shí)施步驟:輸入指令詞。盡量使用結(jié)構(gòu)化提示詞:背景,角色,目標(biāo)和任務(wù)。

應(yīng)用示例:

02?表示學(xué)習(xí)和檢索技術(shù)

表示學(xué)習(xí)和檢索技術(shù)是互相配合的兩種技術(shù)。

(來(lái)源于網(wǎng)絡(luò))

表示學(xué)習(xí)是指將文本、圖片等數(shù)據(jù)轉(zhuǎn)化為數(shù)學(xué)向量,這些向量能夠捕獲原始數(shù)據(jù)背后的語(yǔ)義信息。

檢索技術(shù)則是利用這些向量化后的數(shù)據(jù)進(jìn)行高效查找相似內(nèi)容的過(guò)程。

簡(jiǎn)單來(lái)說(shuō),就是我們可以自己“投喂”自己家的知識(shí)庫(kù)進(jìn)去了,整個(gè)運(yùn)作機(jī)制是先檢索自己的知識(shí)庫(kù),通過(guò)向量運(yùn)算來(lái)將距離最近的結(jié)果返回前給用戶(hù)。

技術(shù)難度:????????

適用邊界:

主要用于搜索、推薦、問(wèn)答系統(tǒng)等領(lǐng)域,解決模糊查詢(xún)、相關(guān)性匹配等問(wèn)題。

(構(gòu)建表示學(xué)習(xí)和檢索系統(tǒng)需要一定的機(jī)器學(xué)習(xí)基礎(chǔ)和專(zhuān)業(yè)知識(shí),涉及深度學(xué)習(xí)模型搭建、向量數(shù)據(jù)庫(kù)管理和索引算法等方面。)

實(shí)施步驟:

第一步:準(zhǔn)備知識(shí)庫(kù)

第二步:運(yùn)用深度學(xué)習(xí)模型將文本或其他類(lèi)型的數(shù)據(jù)轉(zhuǎn)換為向量;

第三步:將這些向量存儲(chǔ)在專(zhuān)屬的向量數(shù)據(jù)庫(kù)中;

第四步,當(dāng)用戶(hù)發(fā)起查詢(xún)時(shí),計(jì)算查詢(xún)向量與數(shù)據(jù)庫(kù)內(nèi)所有向量的距離,找出最相近的結(jié)果返回結(jié)果。

應(yīng)用示例:

在新聞推薦系統(tǒng)中,系統(tǒng)可以將用戶(hù)的歷史閱讀行為和新聞標(biāo)題轉(zhuǎn)為向量,然后快速找到與用戶(hù)興趣相關(guān)的最新文章推薦給用戶(hù)。

03?Fine-tune(微調(diào))技術(shù)

Fine-tune俗稱(chēng) “微調(diào)”,就是“借用”預(yù)訓(xùn)練模型的強(qiáng)大基礎(chǔ),通過(guò)少量額外訓(xùn)練讓它掌握更專(zhuān)業(yè)、更精細(xì)的技能,從而解決實(shí)際問(wèn)題的一種高效策略。

(來(lái)源于網(wǎng)絡(luò))

打個(gè)比方,就像是讓你的孩子在已經(jīng)學(xué)會(huì)基礎(chǔ)數(shù)學(xué)知識(shí)之后,再針對(duì)某個(gè)專(zhuān)門(mén)的數(shù)學(xué)奧林匹克競(jìng)賽進(jìn)行針對(duì)性訓(xùn)練的過(guò)程。從而對(duì)某一個(gè)細(xì)分領(lǐng)域有更深的掌握。

技術(shù)難度:????????

適用邊界:

適用于各種定制化的自然語(yǔ)言處理任務(wù),包括但不限于情感分析、文本分類(lèi)、命名實(shí)體識(shí)別以及特定領(lǐng)域的問(wèn)答系統(tǒng)等。

(Fine-tune需要具備一定的機(jī)器學(xué)習(xí)實(shí)踐經(jīng)驗(yàn)和數(shù)據(jù)集準(zhǔn)備能力,但許多平臺(tái)提供了便捷的微調(diào)工具和教程,降低了入門(mén)門(mén)檻。)

實(shí)施步驟:

第一步:選用一個(gè)適合的預(yù)訓(xùn)練大模型作為基礎(chǔ);

第二步:收集并整理用于特定任務(wù)的數(shù)據(jù)集;

第三步:在該數(shù)據(jù)集上對(duì)預(yù)訓(xùn)練模型進(jìn)行額外訓(xùn)練(微調(diào)),以使模型更適應(yīng)特定場(chǎng)景;

第四步:評(píng)估微調(diào)后的模型在驗(yàn)證集上的表現(xiàn),并根據(jù)需求持續(xù)優(yōu)化。

應(yīng)用示例:

若要?jiǎng)?chuàng)建一個(gè)餐廳評(píng)論的情感分析工具,可以采用預(yù)訓(xùn)練的語(yǔ)言模型并對(duì)其進(jìn)行fine-tune,使其學(xué)會(huì)準(zhǔn)確地判斷評(píng)論中的情感極性和傾向性。

最后的話(huà)

簡(jiǎn)單做個(gè)總結(jié),指令工程是當(dāng)下最簡(jiǎn)應(yīng)用的一個(gè)實(shí)施路線(xiàn),但它用的是基于某個(gè)大模型的原生知識(shí),并且會(huì)受制于token等類(lèi)型限制,會(huì)導(dǎo)致回復(fù)前后不一致的情況,不太適合商用。

表示學(xué)習(xí)與檢索技術(shù)專(zhuān)注于從大量文本中提取和利用語(yǔ)義表示以支持高效的檢索和相似性比較。

微調(diào)技術(shù)則是在預(yù)訓(xùn)練模型的基礎(chǔ)上進(jìn)一步優(yōu)化模型能力,使其更精準(zhǔn)地完成特定的自然語(yǔ)言處理任務(wù)。

對(duì)比表示學(xué)習(xí)和檢索技術(shù)和Fine-tune技術(shù),這兩個(gè)技術(shù)實(shí)現(xiàn)的應(yīng)用則更加靈活,通過(guò)知識(shí)庫(kù)就可以調(diào)整輸出內(nèi)容的專(zhuān)業(yè)度,達(dá)到商用目的。應(yīng)用這兩種技術(shù)實(shí)施的團(tuán)隊(duì)至少得3個(gè)人:算法,全棧開(kāi)發(fā)和產(chǎn)品。

人好找,技術(shù)路線(xiàn)也好定,此時(shí)比拼的就是數(shù)據(jù)的質(zhì)量和數(shù)量了。

希望帶給你一點(diǎn)啟發(fā),加油。

作者:柳星聊產(chǎn)品,公眾號(hào):柳星聊產(chǎn)品

本文由 @柳星聊產(chǎn)品 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

該文觀(guān)點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!