大語言模型:LLM的高階應(yīng)用「工具和插件」
在AI大模型如火如荼的今天,如何充分發(fā)揮LLM的潛力,成為業(yè)界關(guān)注的焦點(diǎn)。本文將帶你深入探索LLM的高階應(yīng)用——工具和插件,揭秘它們?nèi)绾螖U(kuò)展LLM的能力邊界,解決實(shí)際應(yīng)用中的痛點(diǎn)。正如工匠需借助精良工具方能打造傳世之作,LLM亦需借助工具和插件,才能在職場中發(fā)揮出最大的價(jià)值。
之前有段時間,網(wǎng)上對于AI大模型比較9.9和9.11那個大的問題,引發(fā)了一波大眾對AI大模型的質(zhì)疑。
當(dāng)你了解LLM的原理后,就知道背后的原因是因?yàn)長LM本身不具備數(shù)學(xué)能力而導(dǎo)致的,它只能進(jìn)行文本預(yù)測。
那么當(dāng)在使用LLM構(gòu)建應(yīng)用程序時,LLM本身又不具備某些能力時,該怎么辦呢?
這時候,就涉及到工具的使用了。例如用戶和你的智能客服進(jìn)行訂單狀態(tài)咨詢時,你需要LLM能夠借助sql語句來查詢你的數(shù)據(jù)庫,然后回復(fù)用戶等。
目前市場上大部分的LLM提供的工具服務(wù),主要分2種類型:工具函數(shù),和插件工具。工具函數(shù):用戶根據(jù)自己項(xiàng)目的需要,通過自定義函數(shù)來實(shí)現(xiàn)一系列能力的擴(kuò)展。
插件:開發(fā)者可以基于自己的API服務(wù)構(gòu)建插件,可上架到GPTSstore中,供第三方使用。
雖然這2種方式有很多地方很像,但是終歸是不同的發(fā)展定位。工具函數(shù),更像是LLM平臺提供的一種擴(kuò)展,而這個擴(kuò)展能力僅得使用方自己來開發(fā)且無法向外推廣。
而類似于GPTs的插件工具,則是一種生態(tài)的構(gòu)建,插件開發(fā)好之后即可以自己用,也可以上架到GPTstore中供第三方使用。在國內(nèi),雖然沒有插件市場,但是卻形成了類似于扣子的智能體市場,提倡Agent即服務(wù)的思想。
不管是工具函數(shù)、插件、還是智能體平臺,都是在不斷擴(kuò)大LLM的能力邊界,雖然目前GPTs發(fā)展的并不理想,但是從長遠(yuǎn)發(fā)展來看,這3個因其定位不同,都有很大的市場空間。
目前GPT Store僅對Plus會員開放,因其中智能體的同質(zhì)化嚴(yán)重,用戶槽點(diǎn)較多,可能短時間很難發(fā)展起來,所以這里我們就先不考慮插件這種方式
我們以kimi為例,來介紹它的函數(shù)工具。如果不嫌麻煩的話,可以直接查看官方的API文檔:https://platform.moonshot.cn/docs/api/tool_use
在工具的使用上,kimi一方面支持自定義函數(shù)工具,另一方面也提供了最常用,聯(lián)網(wǎng)搜索的內(nèi)置工具($web_search),不過這個內(nèi)置的聯(lián)網(wǎng)搜索工具函數(shù)除了額外的Tokens消耗外,還需再收取一次調(diào)用費(fèi)用,價(jià)格為 ¥0.03/次。
我們這里主要介紹一下,Kimi的自定義函數(shù)工具,國內(nèi)其他的LLM所提供的函數(shù)工具,基本上也都差不多。整體流程如下
上圖是官方給的一個時序圖,如果不懂技術(shù)的伙伴,可以直接看下面這張圖,邏輯都是一樣的。
那么工具的使用(Tool Use)具體是怎么實(shí)現(xiàn)的呢?這里放一個官方示例,來感以下:
雖然代碼有點(diǎn)兒長,不過還是比較好理解,在kimi中使用工具,需要先定義好tools,包括:
函數(shù)名:即調(diào)用的函數(shù)名;
函數(shù)描述:即函數(shù)的作用,以及什么情況下LLM出發(fā)此函數(shù),這部分需要不斷的調(diào)整和測試,盡可能的覆蓋所有的函數(shù)調(diào)用場景。函數(shù)參數(shù):即函數(shù)的入?yún)?,LLM可以從用戶的提問中,來提取入?yún)ⅰ?/p>
在tools中定義好函數(shù)后,后面就是具體的函數(shù)代碼實(shí)現(xiàn),以及函數(shù)的調(diào)用了。
以上便是LLM的工具使用,由于篇幅限制,感興趣的伙伴可以直接閱讀官方文檔,學(xué)習(xí)更細(xì)節(jié)的內(nèi)容。
另外就是,有沒有一種開箱即用的工具箱呢?可以根據(jù)我們的需求來進(jìn)行調(diào)用,當(dāng)然有。在LangChain框架中,內(nèi)置了很多工具,如下圖所示:
使用這些工具的前提是,你必須得使用LangChain框架,而LangChain框架,也是目前基于AI大模型進(jìn)行應(yīng)用開發(fā)最強(qiáng)大的框架,不過需要注意的是,LangChain目前迭代的速度非???,這意味著不太穩(wěn)定性,在真實(shí)的業(yè)務(wù)中,如果不是極度依賴LLM那么還是建議基于LLM平臺的API來構(gòu)建應(yīng)用即可。
好了今天的分享就先到這,感謝觀看。
撰文: 長弓PM
本文由人人都是產(chǎn)品經(jīng)理作者【長弓PM】,微信公眾號:【AI產(chǎn)品經(jīng)理社】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!