OpenAI大總管Brad Lightcap詳談如何拉客戶,toC與toB的糾結(jié),以及OpenAI的邊界
本文為硅星人在GTC現(xiàn)場為大家?guī)淼膶υ拰?shí)錄。在這場大概50分鐘的對話中,Brad LightCap分享了自己對現(xiàn)有模型能力的思考、對未來模型演進(jìn)方向的預(yù)測,GPTs和定制化服務(wù)的業(yè)務(wù)思路,OpenAI分別面對企業(yè)、開發(fā)者和普通消費(fèi)者時的使命及角色定位,OpenAI企業(yè)級規(guī)模合作的最新進(jìn)展,并基于親身經(jīng)驗(yàn)給想要部署AI技術(shù)的中小型公司提出實(shí)際建議。
英偉達(dá)GTC大會來到第二天,除了首日的CEO黃仁勛主題演講,還有近800場會議討論和技術(shù)培訓(xùn)在后續(xù)這3天陸續(xù)舉行。
AI領(lǐng)域的世界大聚會,有當(dāng)紅炸子雞OpenAI出現(xiàn)的場子當(dāng)然是最熱的。上午9點(diǎn),主會場一扇會議室門前排起長龍,奧特曼心腹大將、OpenAI首席運(yùn)營官Brad LightCap即將與 NVIDIA企業(yè)計(jì)算副總裁Manuvir Das進(jìn)行一場名為「What’s Next in Generative AI」的深度討論。
這是GTC 大會除了「Transformer論文作者八仙同臺」之外最受參會者歡迎的panel之一,開場前整間大會議室就全部坐滿。Manuvir Das向觀眾介紹說,“Brad Lightcap是Sam Altman的秘密武器,是他非常依賴的人?!?/strong>
這里多說幾句Brad LightCap的背景。
Brad生于91年,畢業(yè)于杜克大學(xué),16年到18年在YC做專注人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的投資人,投資組合包括Airbnb、Stripe、Instacart 和 Coinbase等。18年底開始任職OpenAI 的CFO,憑借其專業(yè)金融背景為OpenAI在組織運(yùn)營和財(cái)務(wù)結(jié)構(gòu)方面發(fā)揮了重要作用,包括處理微軟的10 億美元投資。而Sam Altman 14年起做了五年的YC總裁,有四年都兼顧OpenAI,直到19年全心轉(zhuǎn)業(yè)。也就是說Brad LightCap是從YC追隨奧特曼投身OpenAI相當(dāng)早的那批人。
2020年,Brad LightCap晉升為COO,職責(zé)擴(kuò)大到完善OpenAI整體的業(yè)務(wù)和商業(yè)戰(zhàn)略。去年11月OpenAI高層最混亂的時候,也是他第一個站出來發(fā)表對內(nèi)聲明,告訴員工“Sam Altman 并非因‘不當(dāng)行為‘被解雇”,出面穩(wěn)定公司上下軍心。
在這場大概50分鐘的對話中,Brad LightCap分享了自己對現(xiàn)有模型能力的思考、對未來模型演進(jìn)方向的預(yù)測,GPTs和定制化服務(wù)的業(yè)務(wù)思路,OpenAI分別面對企業(yè)、開發(fā)者和普通消費(fèi)者時的使命及角色定位,OpenAI企業(yè)級規(guī)模合作的最新進(jìn)展,并基于親身經(jīng)驗(yàn)給想要部署AI技術(shù)的中小型公司提出實(shí)際建議。
他還“凡爾賽”了一把,稱團(tuán)隊(duì)內(nèi)部根本沒預(yù)料到GPT-3會大火,所有計(jì)劃都是根據(jù)“GPT-4是第一個現(xiàn)象級產(chǎn)品”預(yù)測來安排的,導(dǎo)致后面不得不加快節(jié)奏。而面對Manuvir Das提出的“OpenAI正在忙著的未來大動作”問題時,Brad也做出了巧妙、但讓人充滿遐想空間的回答。
以下是硅星人在GTC現(xiàn)場為大家?guī)淼膶υ拰?shí)錄:
一、OpenAI的自我定位,與企業(yè)合作策略、數(shù)據(jù)部署和技術(shù)建議
Manuvir Das:Brad,告訴我們一些關(guān)于你在Open AI的角色,你日常的工作內(nèi)容,以及有什么事情讓你夜不能寐?
Brad Lightcap:當(dāng)然。很高興能來到這里。我是OpenAI的首席運(yùn)營官,我花了很多時間思考如何將我們在研究實(shí)驗(yàn)室里構(gòu)建的東西帶給客戶、用戶和合作伙伴。通常人們會問,這包括哪些內(nèi)容?我會回答,除了實(shí)際研究之外的所有事情。他們不允許我接觸計(jì)算機(jī)。我多數(shù)時間都和客戶一起,試圖解決如何把這項(xiàng)技術(shù)融入到世界中。至于什么讓我夜不能寐,現(xiàn)在我可以說沒有什么,除了Slack(笑)。
但我覺得接下來幾年會非常有趣。我們現(xiàn)在還處于曲線的平坦部分,就像是第一局的邊緣。隨著技術(shù)的構(gòu)建、發(fā)展和系統(tǒng)擴(kuò)展,我們認(rèn)為它的能力將會非常驚人。
Manuvir Das:有趣的是,許多人將OpenAI等同于ChatGPT,并把它看做給普通消費(fèi)者體驗(yàn)的技術(shù)。但你們現(xiàn)在跟許多企業(yè)合作了。我們NVIDIA在和客戶交流時,發(fā)現(xiàn)多數(shù)客戶都建立了一套自己內(nèi)部的rag系統(tǒng),并稱是通過OpenAI實(shí)現(xiàn)的。所以我非常好奇你和企業(yè)客戶合作的經(jīng)驗(yàn)是怎樣的?
Brad Lightcap:是的,當(dāng)我們推出GPT時,使用率顯然飆升,那時這并非是一個面向企業(yè)的產(chǎn)品。我們花了六個月時間試圖弄清楚到底發(fā)生了什么,并確保我們有足夠的GPU來滿足用戶。實(shí)際上去年的后半年我們才真正意識到,企業(yè)中也存在著不斷增長的應(yīng)用需求,公司開始引入ChatGPT。這就是為什么我們最終推出了GPT企業(yè)版和團(tuán)隊(duì)版。
但我們確實(shí)看到了來自不僅是中小型企業(yè)和中等市場,甚至是財(cái)富500強(qiáng)的需求量。我們有超過90%的財(cái)富500強(qiáng)公司以某種形式在使用ChatGPT。我們正在努力將他們?nèi)恳氲狡髽I(yè)版產(chǎn)品中。因?yàn)樗_實(shí)具有真正的吸引力和適用性,而且非常橫向。據(jù)我們所知,公司的每個職能部門都能找到這項(xiàng)技術(shù)的用武之地,我們并不需要構(gòu)建很多垂直應(yīng)用,它就是有效。
比如,如果你在財(cái)務(wù)團(tuán)隊(duì),需要做大量數(shù)據(jù)分析,進(jìn)行對賬和稅務(wù)統(tǒng)計(jì),你可以將大型電子表格丟進(jìn)Chat GPT中,然后要求對賬,它就會自動完成了。它甚至可以把HR團(tuán)隊(duì)轉(zhuǎn)變成數(shù)據(jù)科學(xué)家。因此你會發(fā)現(xiàn),是人們自然而然地找到了它的適用性。OpenAI也正在努力去構(gòu)建更優(yōu)秀的工具版本給他們。
Manuvir Das:這確實(shí)令人驚嘆。我們在與企業(yè)客戶交談時發(fā)現(xiàn),最受歡迎的用例就是作為「助手」。你知道Brad,就像擁有一個免費(fèi)實(shí)習(xí)生,不管是什么工作職能,你都可以構(gòu)建一個聊天機(jī)器人來協(xié)助你完成工作,并且可以得到80%的答案。你是不是也這樣認(rèn)為?
Brad Lightcap:是的,確實(shí)有一些關(guān)鍵用例。其中之一是“最后一公里工程”。我們有一個團(tuán)隊(duì)負(fù)責(zé)解決這個問題,試圖手把手地來幫助客戶完成工作。我認(rèn)為隨著模型變得更好,一些這樣的需求將開始減少。因此我看到的有兩個方面,一是解決模型在能力上仍然存在的缺陷,二是嘗試為模型配置所有需要的上下文以便完成任務(wù)。我不認(rèn)為第二部分會消失,世界非常廣闊且混亂。但我認(rèn)為隨著模型的改進(jìn),人們將真正感受到加速,第一部分的問題將會得到解決。
Manuvir Das:顯然,你們有這些偉大的模型為GPT提供動力。圍繞Open AI,已經(jīng)涌現(xiàn)出一個完整的工具生態(tài)系統(tǒng),幫助人們使用這些技術(shù)。我很好奇對于你們來說,把自己的使命和角色定位成「開發(fā)人員使用技術(shù)的全平臺」,還是僅僅想成為「核心模型服務(wù)的提供者」?
Brad Lightcap:我認(rèn)為兩者都有,好理解嗎?我們的看法是一切都是對智能的提取,關(guān)鍵在于我們想構(gòu)建多少層。但我們會構(gòu)建任何能加速世界開始廣泛使用這項(xiàng)技術(shù)、將智能引入到應(yīng)該到達(dá)的每一個角落的東西。
一個我認(rèn)為需要謙遜的部分,就是開始意識到世界有多大,有多少地方可以應(yīng)用到我們的技術(shù)。這樣當(dāng)我花費(fèi)每一分精力去考慮是否應(yīng)該構(gòu)建某個特定的第一方應(yīng)用時,我會提醒自己外面有人對這個特定問題比我們更加關(guān)心。那么,我們?nèi)绾谓⒁惶坠ぞ呒?,讓他們能夠自己?gòu)建他們想要的技術(shù)、工具和應(yīng)用程序?然后我們專注于哪些事情呢?就是那些原始的、基礎(chǔ)的層面,這將使人們受益,并且創(chuàng)造出偉大的用戶體驗(yàn)。
Manuvir Das:你知道這很有趣,因?yàn)樵谀撤N程度上,你們經(jīng)歷的旅程和NVIDIA在過去幾年中的歷史相似。那就是,我們在NVIDIA有一種模式,我們喜歡花時間做沒有其他人能做的事情,讓其他人做能做的事情。因?yàn)槟愀杏X到自己有一種責(zé)任,你的工作是讓這個工具盡可能好,盡可能廣泛地影響其他人圍繞它構(gòu)建東西。我確信OpenAI感受到了一種責(zé)任感,就像你說的,可以用這個工具影響整個世界,這是一件非常強(qiáng)大的事情。
我還在想的另一件事是—— Jensen昨天在他的演講中也提到了,在100萬億美元的行業(yè)中,科技界一直是關(guān)于成本的。每家公司都必須有一個IT部門,有預(yù)算,都是關(guān)于如何減少成本。新技術(shù)的顛覆性是因?yàn)樗苁鼓承┦赂阋?。我相信我們所處的位置,真正關(guān)于的是為公司創(chuàng)造新的機(jī)會、新的價值。你們是不是也這樣看待這個問題?
Brad Lightcap:確實(shí),如果你從根本上看看這項(xiàng)技術(shù)到底是什么,它其實(shí)就是一種能力的規(guī)?;嵘軌?qū)⒛承┤蝿?wù)外包給具有通用學(xué)習(xí)能力,并能夠預(yù)測性地改善的模型,無論是通過規(guī)模擴(kuò)大還是通過更多信息、更多上下文和更多能力。這是對我們來說激動人心的部分。
從企業(yè)的角度來看,你會想到大型企業(yè)實(shí)際上有多復(fù)雜,以及有多少低掛果實(shí)可以讓你說,“你知道嗎,對于這個特定的事情,我們實(shí)際上可以將工作流的部分外包給一個AI,它不僅能在基線水平上執(zhí)行,而且還會隨著時間的推移做得更好,并逐漸掌握整個價值鏈?!边@就允許人們專注于其他事情。所以我們在實(shí)踐中看到的是,你不必花兩個小時坐在那里急到薅頭發(fā),試圖把收入對賬。一個AI可以為你探索并解決問題,你只需要提出問題,突然間就被解決了。而本來要花那些時間的人,現(xiàn)在可以去思考更重要的事情——我之所以這么說,是因?yàn)槲乙补芾碡?cái)務(wù)部門(笑)。
Manuvir Das:Brad,今天這個房間里有很多來自企業(yè)背景的人。我想很多人心中都有這個問題,你們的模型已經(jīng)非常出色地吸收了世界和互聯(lián)網(wǎng)上的各種知識。而每家公司也都有自己存儲在各種地方的知識庫。顯然,不同的人對于如何利用這些數(shù)據(jù)有不同的角度和方法。我很好奇,對于OpenAI來說,你們?nèi)绾巫屵@些公司真正將他們擁有的所有數(shù)據(jù)納入到流程中?
Brad Lightcap:是的,這確實(shí)是我們被問最多的一個問題。我想可能也是目前最不成熟的問題,不過是可以預(yù)期的。我們正處于這種范式轉(zhuǎn)變的早期階段。人們能夠探索和使用這種核心技術(shù),但將所有基礎(chǔ)設(shè)施和系統(tǒng)與之掛鉤還需要一些時間。現(xiàn)在能看到的是,人們能夠?qū)⒂腥さ臄?shù)據(jù)庫與明確的用例相結(jié)合,并讓模型應(yīng)用于這兩者。你將這三個因素聯(lián)系在一起,就能獲得非常好的效果。
最近我們與Klarna的合作就是一個很好的例子。Klarna是一家非常重視AI的公司。他們在這方面已經(jīng)做了一段時間。但他們采取了正確的策略,即真正從特定的技術(shù)實(shí)施入手,將問題范圍限定在一個小范圍內(nèi)。他們研究了工作流程中一個很小的部分,使用了一個非常具體的數(shù)據(jù)集,并對模型進(jìn)行了特定的微調(diào)。先讓這一部分工作起來,然后再從此擴(kuò)展?,F(xiàn)在已經(jīng)處理了大量工作并節(jié)省了大量時間。
我認(rèn)為這就是我們應(yīng)該采取的策略,不要從一開始就力求過大,也不要志向不高,而是從一個可以限定問題范圍的事物入手,讓它工作起來,然后再擴(kuò)展。不要試圖從第一天就吞下整個海洋,但也不要缺乏雄心。
Manuvir Das:我看過你在很多采訪里提到這一點(diǎn),你和一些公司開會時,他們似乎認(rèn)為GenAI能夠奇跡般地讓公司變好,改變市場地位。但事實(shí)上,更好的做法是從具體的用例入手,從中獲取價值,然后再推而廣之。
作為給那些剛開始嘗試這項(xiàng)技術(shù)的公司的建議,你會怎么說?當(dāng)然像英偉達(dá)這樣,現(xiàn)在已經(jīng)有上百個聊天機(jī)器人在內(nèi)部運(yùn)行于不同場景,這固然是一種有機(jī)生長模式。但對于新手來說,你會建議他們首先花些時間思考一下如何統(tǒng)籌規(guī)劃,選擇一種初始路線,還是廣泛嘗試,任其自然發(fā)展?
Brad Lightcap:在2023年的大部分時間里,我常對我們團(tuán)隊(duì)說,我們其實(shí)不是在做銷售,我們是在做“心理治療”。公司進(jìn)來,通常是一個C級的人坐在我們的會議室里,進(jìn)行到五分鐘左右時,他們就會開始傾訴所有問題和他們擔(dān)心的事情,問我們是否能解決這些問題,比如“董事會希望我下個季度推出哪些新品”…通常我們得稍微勸勸他們,給他們一點(diǎn)水喝,讓他們冷靜下來(笑)。
Manuvir Das:這個治療環(huán)節(jié)你們收費(fèi)嗎?
Brad Lightcap:那倒沒有哈哈。但一旦我們進(jìn)入真正的談話部分,我們的觀點(diǎn)就是,真正考慮一下,你的業(yè)務(wù)中哪些地方有機(jī)會讓運(yùn)營方式,管理方式得到改進(jìn)。對很多人來說,最頭大的往往是客戶支持,這是我們聽到的最頻繁的抱怨:“沒有人喜歡他們客戶體驗(yàn)的質(zhì)量、這上面花了很多錢、從來都不太有效,這些事他們收到最多的客戶投訴。”
Manuvir Das:這恰好是一個非常橫向的領(lǐng)域?qū)??因?yàn)樗婕霸S多行業(yè)。
Brad Lightcap:沒錯。所以我們傾向于推薦多管齊下的方法。首先要確定兩三個確實(shí)存在棘手問題的領(lǐng)域,但同時又能對問題范圍進(jìn)行一定限制。
以客戶支持為例,這是一個由多任務(wù)組成的工作流程,涉及不同程度的人參與和介入。擁有大量數(shù)據(jù)和上下文信息會有所幫助。所以你可以回顧之前提到的數(shù)據(jù)、流程和模型能力這三個層面,找出最初的實(shí)施方案是什么樣的,然后從那里開始不斷擴(kuò)展和推廣。選擇幾個這樣定制化、基于平臺的項(xiàng)目來推進(jìn)。
另一個建議是,讓你的整個團(tuán)隊(duì)接觸ChatGPT。這是我們?nèi)ツ曛衅跊]有太多考慮的,但隨著我們部署了GPT并與一些使用它的公司交流后,才意識到要讓員工能夠平等地接觸和使用這項(xiàng)技術(shù)是很重要的。無需過于復(fù)雜或成熟的形式,只是讓員工有機(jī)會說“我知道我的工作內(nèi)容,可以多方嘗試,了解它的能力范圍,看看它如何幫助我更好地完成工作”就夠了,而且這種探索過程會自發(fā)地發(fā)生。公司有時會過于追求一種很規(guī)范的AI戰(zhàn)略,做一次大規(guī)模推廣,推出專屬的聊天機(jī)器人等。但我認(rèn)為至少目前,90%的價值都來自于簡單地讓員工接觸和使用這些工具,不必過多思考。
二、關(guān)于消費(fèi)級GPTs和完全定制模型,“企業(yè)用AI就像老板用人”
Manuvir Das:我非常同意。因?yàn)楫?dāng)人們第一次嘗試使用這種技術(shù)時,它帶來的價值是如此明顯,以至于你會愿意努力去解決遇到的任何問題。所以Brad,在與企業(yè)客戶合作并為他們提供不同使用場景的過程中,你們還推出了可以讓人們輕松構(gòu)建的GPTs,對嗎?可以為觀眾簡單介紹一下這是什么,為什么要走這條路線,以及目前的進(jìn)展如何嗎?
Brad Lightcap:好的,我會試著將其放在我們戰(zhàn)略的更大背景中加以解釋。我們擁有GPT-4和不管下一代出來的是什么,這些核心的通用智能模型,我們花費(fèi)了大量精力思考如何讓人們能夠根據(jù)自身需求對這些技術(shù)或模型進(jìn)行個性化定制,使其更加專注于特定任務(wù),提高在特定領(lǐng)域的表現(xiàn)。所以在過去幾個月里,我們在GPTs、定制模型方面所做的大部分工作都是朝著這個方向的。
你可以將GPTs和定制模型看作是光譜的兩端:GPTs就是一種非常簡單、輕松的方式。從ChatGPT的功能中裁剪出一小部分,專注于給定任務(wù)的使用。比如,如果你想讓模型記住某些特定信息、能夠調(diào)用外部數(shù)據(jù)、訪問PDF或電子表格、擁有某種特定個性、以可預(yù)測和可重復(fù)的方式使用某些工具,你只需描述一下需求,GPTs 就能相應(yīng)地自動配置出來。而且我們發(fā)現(xiàn)企業(yè)對此也有巨大需求,這并不奇怪,因?yàn)槿藗冮_始意識到可以將這種技術(shù)應(yīng)用到哪些工作流程中,所以他們只需對每個需求進(jìn)行正確編碼并調(diào)用即可。
而定制模型則是光譜的另一端,是一種全方位的定制化服務(wù)。我們會針對特定使用場景,充分調(diào)整和優(yōu)化GPT-4或其他模型,以最大限度發(fā)揮它在該領(lǐng)域的性能表現(xiàn)。這種服務(wù)我們提供的范圍相對有限,因?yàn)樗鼘ξ覀儊碚f是資源和時間密集型的。但在早期階段,我們已經(jīng)取得了巨大的成功,雖然仍在不斷探索和試驗(yàn),但已成功提高了模型在大量領(lǐng)域的能力表現(xiàn)。
Manuvir Das:這確實(shí)非常迷人。因?yàn)轱@而易見,你們最初開啟這一旅程時,是從一個大型通用模型出發(fā)的,這個模型在諸多領(lǐng)域表現(xiàn)出令人驚訝的出色能力,并且在不斷變得更好。同時,如果回顧過去一年,我們也看到了模型生態(tài)系統(tǒng)中涌現(xiàn)出眾多其他模型。雖然它們的能力可能并不像OpenAI內(nèi)部的模型那樣強(qiáng)大,但在某些特定領(lǐng)域,它們也在不斷進(jìn)步。所以你認(rèn)為在企業(yè)內(nèi)部,是否大型模型和小型專業(yè)模型都將扮演角色?或者你認(rèn)為只需要一個大型模型就可以用于不同場景?
Brad Lightcap:是的,我們確實(shí)認(rèn)為所有規(guī)模的模型都將發(fā)揮作用。我個人的心智模型是,盡可能將企業(yè)AI部署的方式映射到現(xiàn)代企業(yè)構(gòu)建人力資本的角度。就像你不會聘請25000名博士來運(yùn)營公司,因?yàn)槟菍⑹沁^度配置,你可能只需要5到10個左右。同樣,你也不會將“GPT-X”或最新的大模型都應(yīng)用于每個單一的問題。你可能需要一系列在不同領(lǐng)域具有專業(yè)化的多樣化模型,它們針對不同的使用場景經(jīng)過了微調(diào)和優(yōu)化。
我猜想,隨著時間推移,這些模型的整體性能將越來越好,因此對它們進(jìn)行迭代、微調(diào)并努力使之在任何特定領(lǐng)域表現(xiàn)出色的需求將會減弱。但你當(dāng)然不需要一個一體化模型來解決所有問題。所以我們目前正在努力的一件事,是設(shè)法讓人們能夠根據(jù)具體使用場景動態(tài)調(diào)用不同的模型,這樣就可以更好地分配智能資源。
但是,我認(rèn)為你可以將這種多樣化的模型想象成公司內(nèi)不同級別和角色的人,有實(shí)習(xí)生級別的模型、中層管理者級別的模型、高級管理者級別的模型、以及某些專門領(lǐng)域的專家級模型,每個級別和角色都有其存在的位置和價值。總的來說,這種多樣化是必要的。
三、現(xiàn)有模型能力、未來模型方向、OpenAI下一代模型隱藏信息
Manuvir Das:你提出了一個有趣的問題,考慮到你的身份和工作,我相信觀眾也在思考要問你:如果說模型能力在1到10的范圍內(nèi),你認(rèn)為我們現(xiàn)在處于什么水平?是1分嗎,還是7分,你怎么看?
Brad Lightcap:是的,我想對剛剛說的再補(bǔ)充一點(diǎn),我們所做的工作以及我們?nèi)绾卧谄髽I(yè)部署這項(xiàng)技術(shù)的挑戰(zhàn)中有趣的一點(diǎn)是,我們需要將模型能力映射到人力資本的結(jié)構(gòu)上,但不斷變化的是模型能力本身,基本每6個月就會獲得提升。所以曾經(jīng)被視為實(shí)習(xí)生級別的模型,6個月后就開始看起來有點(diǎn)像中層副總裁級別的模型了;而之前的中層副總裁級別模型也開始像高級總監(jiān)級別模型。
Manuvir Das:你剛剛是不是diss了一大批VP?
Brad Lightcap:只是粗略類比(笑)。但這確實(shí)是一種有趣的現(xiàn)象,企業(yè)需要動態(tài)管理這種情況,我認(rèn)為總的來說這是件好事,是一種富余。因此,我們花了大量時間與公司思考,在任何給定的問題上,我們應(yīng)該投入什么資源?隨著模型能力的提高,我們是否應(yīng)該重新考慮這些組合?
Manuvir Das:這在某種程度上成為了一種新形式,就像你開始談到的,讓我想起iPhone問世時的情況 ——當(dāng)時有一種普遍觀念認(rèn)為,iPhone對消費(fèi)者來說很好,但公司將很難采用iPhone,因?yàn)樗狈@方面或那方面的控?,F(xiàn)在回頭看,這聽起來似乎也很可笑。
讓我們稍微轉(zhuǎn)換一下話題,談?wù)劷酉聛頃l(fā)生什么。我在與一些已經(jīng)走在前沿的客戶交談時注意到,他們開始從過去“某種形式的信息檢索”轉(zhuǎn)移到使用這種技術(shù)作為一種代理,試圖在公司內(nèi)部執(zhí)行操作、運(yùn)行流程、調(diào)用功能,產(chǎn)生行動。你是否也看到了這一點(diǎn),你認(rèn)為目前的技術(shù)水平如何?因?yàn)槿绻矣幸粋€助手,只是查看它的輸出那很好,但如果我讓它為我執(zhí)行操作,我就必須更加信任它對嗎?
Brad Lightcap:是的,這正是讓我感到興奮的地方。這在很大程度上也體現(xiàn)了我們在OpenAI是如何看待這項(xiàng)技術(shù)的用途以及應(yīng)該如何使用它的。某些方面來說,我們有點(diǎn)嘲笑當(dāng)下AI系統(tǒng)實(shí)現(xiàn)的常見方式,那就是以某種信息檢索為基礎(chǔ)。從某種意義上說,它們就像是世界上最糟糕的數(shù)據(jù)庫 —非常緩慢、成本很高、又不100%準(zhǔn)確。雖然它們正在變得越來越好,但為什么要將它們用作數(shù)據(jù)庫呢?為什么要將它們用于需要高精度召回的場景?如此使用這些系統(tǒng)似乎有點(diǎn)奇怪——我不是在批判。
但我們真正希望看到這些系統(tǒng)朝推理智能體的方向發(fā)展。所以,關(guān)鍵是如何利用模型從某種數(shù)據(jù)源提取信息的核心能力,思考這些信息,然后基于對這些信息的見解進(jìn)行綜合,并采取行動。要實(shí)現(xiàn)這一點(diǎn),需要兩個條件:一是提高模型的推理能力,二是賦予它某種執(zhí)行器,使之能在現(xiàn)實(shí)世界中采取行動。我認(rèn)為這將成為接下來的兩個發(fā)展趨勢。
我們預(yù)計(jì),推理能力將成為模型改進(jìn)的下一個重點(diǎn)領(lǐng)域,提升將加速進(jìn)行。同時,我們還需考慮如何賦予模型解決多步驟問題的能力。
我給你舉一個醫(yī)療保健領(lǐng)域的例子。如果你讓一個模型查看病歷,目前它能夠提取出病歷信息,執(zhí)行一些基本操作,比如總結(jié)信息、根據(jù)輸入更新信息。但能否讓它進(jìn)一步思考這些信息呢?如果能思考,它是否能從中得出某些見解,從而為之后的第二步或第三步行動提供啟示?它可以幫助后續(xù)隨訪患者、協(xié)助疾病診斷、協(xié)助開具處方、實(shí)際與患者溝通并告知何時何地取藥、給出用藥劑量和服用時間,并在數(shù)周后再次提醒患者服藥。
這就是我們從幾年期內(nèi)來看待這些系統(tǒng)的方式。
Manuvir Das:那你認(rèn)為這種情況會發(fā)生嗎,是因?yàn)楹诵哪P驮谶@方面的能力會變得更強(qiáng),還是看到一種方法,即會有一個獨(dú)立的模型或系統(tǒng)專門用于推理,以補(bǔ)充現(xiàn)有模型?
Brad Lightcap:我認(rèn)為現(xiàn)有系統(tǒng)實(shí)際上已經(jīng)相當(dāng)不錯了。如果你去問GPT-4關(guān)于你假設(shè)的那種情況,要求它一步步解釋它的思考過程,它會以那種方式向你解釋。所以模型已經(jīng)知道了行動路徑,現(xiàn)在的問題是它是否能夠執(zhí)行每一個行動步驟,識別出應(yīng)該執(zhí)行的具體操作,并且是否能訪問到執(zhí)行所需的資源。
Manuvir Das:聽你這樣說真令人振奮,因?yàn)槲覀兇_實(shí)開始看到這種趨勢的出現(xiàn)。很顯然,你們在OpenAI對此工作越多,對所有人來說就越好。所以Brad,我們剛才談到了智能體的概念,如果從你的角度來看,在接下來的一年、三年和五年內(nèi),OpenAI會有哪些重大轉(zhuǎn)變,或者你們在做的工作,能真正改變?nèi)藗兪褂眠@項(xiàng)技術(shù)的方式?
Brad Lightcap:嗯,有些是我不能透露的,但我可以回答一些。我們并不認(rèn)為模型的核心能力提升已經(jīng)接近天花板,我們認(rèn)為未來的擴(kuò)展空間還很大,這讓我們很興奮。OpenAI正努力理解如何推動模型在除了純粹智力之外的其他維度上取得進(jìn)步,我們對這方面的工作進(jìn)展感到很好。
從我的角度來看,我們之前提到的一個問題是,對于使這些系統(tǒng)在生產(chǎn)和部署環(huán)境中發(fā)揮作用,將需要哪些標(biāo)準(zhǔn)、框架和工具來組織所需的信息。有一部分工作是構(gòu)建系統(tǒng)本身,另一部分則是確保我們有途徑來部署這項(xiàng)技術(shù),使其在生產(chǎn)環(huán)境中真正發(fā)揮作用。
Manuvir Das:這確實(shí)是一個不太容易的問題,但你處理得很好哈哈。讓我換個方式問你吧。作為一家公司,你們可以專注于整體提升技術(shù),就像你們現(xiàn)在所做的那樣。你們也可以專注于企業(yè)客戶、全球各行業(yè)以及整個商業(yè)領(lǐng)域,因?yàn)槟抢镉泻芏鄼C(jī)會。那么你們的思路和重點(diǎn)是什么呢?你們認(rèn)為自己的使命是要幫助全球所有企業(yè)實(shí)現(xiàn)民主化,讓他們都能獲得進(jìn)步嗎,還是你們更多關(guān)注個人消費(fèi)者的用例,因?yàn)檫@對世界來說也是一大利益?
Brad Lightcap:是的,我們的使命就是要確保這項(xiàng)技術(shù)的益處能夠被廣泛分享。那么我們?nèi)绾温鋵?shí)這一點(diǎn)?一方面是確保人們能夠在這個基礎(chǔ)上進(jìn)行建設(shè),正如我之前提到的,這個世界是如此龐大和復(fù)雜,我們無論如何都需要這樣做。界面會發(fā)生變化,數(shù)據(jù)提取層次也會發(fā)生變化,但核心是我們將努力為人們提供有效使用這些工具的途徑,無論他們想在哪里使用。
我們的聯(lián)合創(chuàng)始人Greg Brockman有一個很好的比喻,那就是我們可以以這種方式去思考世界:人工智能被烘焙進(jìn)了經(jīng)濟(jì)之中。“烘焙進(jìn)去”的意思是,你需要將各種原料混合在一起,等待一段時間后就會開始發(fā)揮作用。我們也經(jīng)常這樣想,即我們?nèi)绾握嬲渴疬@項(xiàng)技術(shù),并融入其他”原料”,以便一旦它們混合在一起,事物就會以不同的方式運(yùn)作。
這就是我們花費(fèi)大量時間來實(shí)現(xiàn)使命的方式。從消費(fèi)者的角度來看,我們也有類似的考慮,ChatGPT只是對我們自己API的一種提取。我們只是讓模型更擅長與人對話,并將其作為一種服務(wù)提供,而不是通過API的方式讓人們訪問它。
Manuvir Das:我想是2022年11月30日左右,當(dāng)時你們發(fā)布了ChatGPT,結(jié)果超出了你們的預(yù)期對吧?人們對它的興趣和采用程度令人驚訝。這確實(shí)是一個全新的東西,而且人們一下子就get到了它的影響力,因?yàn)樗侨绱撕唵我子谩?strong>現(xiàn)在回顧一下,距離發(fā)布已經(jīng)一年多了,你有何看法?如果可以重新來過,你們是否會做出一些不同的選擇?
Brad Lightcap:啊,或許我們應(yīng)該加大GPU的配置?這確實(shí)出乎我們的意料。我在這里只代表一下我自己,而非整個公司。我們實(shí)際上并沒有認(rèn)為GPT-3這個模型系列已經(jīng)跨越了將其應(yīng)用于消費(fèi)者或企業(yè)應(yīng)用的門檻。我們本以為GPT-4將會成為第一個跨越這一門檻的模型,所以我們的很多計(jì)劃和預(yù)測都是圍繞2023年3月發(fā)布GPT-4來安排的。
回想起來,我們在那之前的幾個月就已經(jīng)完成了GPT-4的訓(xùn)練,大約是在2022年中期開始訓(xùn)練GPT-4的。所以從那時起已經(jīng)過去將近兩年了。所以我們原本認(rèn)為GPT-4將會成為一個關(guān)鍵時刻,但我們不得不為更早的需求做出一些調(diào)整。但看到人們的熱情確實(shí)令人振奮。這也證明了一點(diǎn),無論是企業(yè)開發(fā)者還是個人用戶,這項(xiàng)技術(shù)都具有一種與生俱來的人性化特質(zhì)——你可以把它交給5歲或95歲的人使用,他們都能夠以自然的方式加以利用。
我認(rèn)為這一點(diǎn)非常重要。我們應(yīng)該繼續(xù)推動系統(tǒng)朝著提高可及性的方向發(fā)展,并降低獲取門檻,確保全球人民都能接觸到它。我們認(rèn)為在ChatGPT上,將其設(shè)為免費(fèi)使用就是朝著正確方向邁出的一步。我們聽到了一些偏遠(yuǎn)地區(qū)的人利用它做出我們無法想象的事情。
Manuvir Das:是的,你提到它具有人性化的一面,這一點(diǎn)與NVIDIA 的理念也非常貼近。我們不僅做人工智能,在某種程度上我們也是一家圖形公司。我們看到了很多機(jī)會,首先是文本界面比編寫代碼更加人性化;而且音頻界面、視覺界面,以及我們所說的虛擬化身,讓你感覺就像是在與另一個實(shí)體對話。當(dāng)然,最終還是要通過其他AI將之轉(zhuǎn)化為文本輸入到常規(guī)對話框中。但你認(rèn)為這種以更加自然的方式讓人類與之交互的能力,能否給這項(xiàng)技術(shù)帶來機(jī)會,真正實(shí)現(xiàn)全球范圍內(nèi)的擴(kuò)展?你認(rèn)為這是否應(yīng)該成為一個值得研究和推進(jìn)的好領(lǐng)域?
Brad Lightcap:我認(rèn)為,今天出生的孩子與計(jì)算機(jī)的關(guān)系將與此刻這房間里的任何人都完全不同。他們根本不會知道必須瀏覽圖形用戶界面、漢堡菜單、下拉列表,要填寫文本框、點(diǎn)擊提交,然后等待確認(rèn)郵件被發(fā)送到收件箱的那些令人痛苦的情景。當(dāng)然,我理解這只是在用現(xiàn)有工具做出權(quán)宜之計(jì),但對于今天出生的孩子來說,這些都將成為完全陌生的體驗(yàn)。10年后、20年后,他們將完全改變與計(jì)算機(jī)交互的方式。
Manuvir Das:這讓我想起了自己的孩子們,他們出生時正值iPad時代的到來。我的兒子們,我記得有這么一個時刻,他們還很小,坐在我腿上時,我操作電腦,他們就會用手按鍵盤上的按鍵,試圖參與進(jìn)來互動。但當(dāng)我女兒到了那個年齡時,兩歲大的她做的動作卻是用手在我的筆記本電腦屏幕上滑動,因?yàn)槟鞘撬赖慕缑?。她根本不知道鍵盤的作用。所以我想未來的界面必將與現(xiàn)在完全不同。
Brad Lightcap:對的。10年后你遞給孩子一臺2020年左右的筆記本電腦,看著他們對著它說話,期待著回應(yīng),卻一無所獲,那將是一個全新的場景。
Manuvir Das:令人振奮的是,到那時你的公司和我的公司都能覺得,自己為這一變革貢獻(xiàn)了力量,不是嗎?這真是太不可思議了。
Brad,我想代表在場的每一個人,由衷感謝OpenAI為世界做出的一切貢獻(xiàn)。我們都渴望看到你們接下來將為世界帶來什么,我們將在這里關(guān)注著你們。祝你和公司一切順利,當(dāng)然也祝 NIVIDIA一切順利。我們隨時在這里,以任何方式為你們提供幫助。我會給我老板發(fā)信息問問,看能否為你們提供更多GPU。再次感謝你的時間,非常感謝!
作者:Jessica
來源公眾號:硅星人Pro(ID:Si-Planet),硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個星球。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @硅星人 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!