OpenAI的CEO都在談的 AI Agent,到底是什么?
作為AI應用落地的方向之一,AI Agent這一概念受到了不少企業(yè)和從業(yè)人員的關注,那么,AI Agent究竟是什么?AI Agent又是如何開展工作的?不妨來看看本文的分析和解讀。
為什么要了解 AI Agent ,因為投資者當前只關注 AI Agent公司,OpenAI 等 AI 前沿公司都在研究它。
AI Agent 是AI應用落地的一個方向。
創(chuàng)業(yè)圈有個玩笑話,我有一個很牛的idea,但就差一個程序員了。未來,AI Agent 就是幫你實現(xiàn)idea的「程序員」。
讀完本文,你會理解 AI Agent 是什么,它是怎么工作的。
一、AI Agent 是什么
AI Agent是指人工智能代理(Artificial Intelligence Agent),是一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能實體。
舉個例子,AI Agent 就像是一個小愛同學,住在你的手機或電腦里,有智慧和觀察能力。
當你對它說:“小愛同學,我有點不舒服。”
它會像魔法一樣,通過觀察你的狀態(tài)、體溫,還有最近 24 小時的行動軌跡,并結合互聯(lián)網(wǎng)上的數(shù)據(jù)和信息,通過一系列眼花繚亂的分析,在 1s 鐘后得出結論,你「陽」了。
然后主動給你生成請假條,你點點頭請假單就發(fā)給你 leader 了。
還貼心的告訴你,家里布洛芬和礦泉水已經(jīng)不夠了,已經(jīng)幫你選好商品,只要你一聲令下,30分鐘后會送到家門口。
它感知到,現(xiàn)在開車并不是一個好的想法,就順手把你回家的車也叫好了,10分鐘后就到樓下,趕緊撤吧。
這就是一系列的 Agent 協(xié)同工作的結果。
二、這么優(yōu)秀,它是怎么工作的
一圖告訴你 AI agent 是怎么工作的。這張圖描述了一個智能體如何處理、分析和響應外部信息的流程。
有點不太明白,是吧,那我來拆解下。
AI Agent 分為 4 個部分:
1. 感知(Perception)
- 這是流程的第一步。AI 通過傳感器、攝像頭、麥克風等,建立起對外部世界進行感知。
- 輸入(Inputs):感知到的信息被輸入到系統(tǒng)中。在這個例子中,輸入是:“我有點不舒服”、我的體溫、精神狀態(tài)、睡眠時間等
- 外部環(huán)境(Environment):系統(tǒng)所在的環(huán)境或上下文。比如“我有點不舒服”這件事,會涉及到天氣、環(huán)境(比如是不是在有花粉過敏的場所)等。
2. 信息處理(Agent的大腦(Brain))
可以說是通用大模型+N多知識庫,用來處理信息。包含以下系統(tǒng):
1)信息存儲相關
記憶系統(tǒng):包括 Storage 和 Memory ,用來存儲長期和短期的數(shù)據(jù)。
比如長期數(shù)據(jù)是我這個人的基本信息、愛好、基礎疾病等;
短期數(shù)據(jù)比如我家的礦泉水只剩下1瓶了,購買之后這個記憶就可以刪除了。
知識庫(Knowledge):包括醫(yī)學知識庫、商品庫等,用來診斷我當前的狀態(tài),以及后續(xù)治療、生活所需的管理。
2)大模型對信息進行處理
基于感知的信息(input + Environment )、記憶、知識庫等信息,進行加工處理,得出結論(Decision Making):“我生病了,而且是「陽」了這種情況”。
3)然后制定下一步計劃( Planning)。
Action/Reasoning 是基于其決策的具體動作,但還沒有實行。
要幫我寫好請假條、幫我買藥、買水、叫車等。
3. 執(zhí)行(Action)
基于 Barin 一系列眼花繚亂的操作,得出了結論,制定了下一步計劃,那就需要執(zhí)行(Action)。
大模型本身不能完成這些任務,需要調(diào)用外部的工具。
這時候就會用調(diào)用第三方的工具(Tools 和Calling API),通過接口或者應用,與其他App進行互動,達到最終效果。
4. 輸出(output)
執(zhí)行之后,需要一個出口,告訴你執(zhí)行結果。比如我的小愛同學。它告訴你:“你陽了,已經(jīng)幫你寫好請假條、叫好車.”
以上就是AI Agent的工作原理。
總的來說,這個系統(tǒng)描述的是一個簡化的模型,展示了是一個 AI agent 如何從感知信息開始,經(jīng)過一系列內(nèi)部處理和決策,最終做出響應的過程。
三、總結
AI Agent 是未來 AI 發(fā)展的方向之一(另外一個方向下篇寫)。
它可以是私人助手,也可以是你工作的幫手,他能放大你的能力。補齊你的短板,讓你成為超級個體。
本文由@產(chǎn)品淺談 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
那,AI發(fā)展的另一個方向是什么呢?
謝謝分享,例子生動形象~好贊