GPT-4剛被Claude3碾壓,奧特曼劇透GPT-5

0 評(píng)論 1161 瀏覽 4 收藏 10 分鐘

最近,有關(guān)GPT-5的消息又多了起來(lái),而前段時(shí)間,Anthropic推出的Claude 3還被評(píng)價(jià)“超越GPT-4”,可見(jiàn),大模型之間的競(jìng)賽仍在繼續(xù)。只是,誰(shuí)會(huì)成為AI行業(yè)真正的巨頭呢?或許還要看生態(tài)。

“我很高興看到GPT-5的智能水平得到提升?!監(jiān)penAI CEO薩姆·奧特曼(Sam Altman)最近在美國(guó)計(jì)算機(jī)科學(xué)家萊克斯·弗里德曼(Lex Friedman)的播客里透露了GPT-5的最新消息。

但被問(wèn)及面世時(shí)間時(shí),奧特曼三緘其口。不過(guò),外媒援引“與OpenAI關(guān)系密切的消息人士”說(shuō)法稱,一些企業(yè)客戶最近獲得了GPT-5的早期訪問(wèn)權(quán)限,測(cè)試其新特性和功能,且評(píng)價(jià)頗高。

接連不斷地GPT -5爆料恰好發(fā)生在另一個(gè)品牌大模型Claude3的走紅之際,今年3月7日,人工智能初創(chuàng)企業(yè)Anthropic發(fā)布了Claude3的三個(gè)版本Haiku、Sonnet和Opus,能力最強(qiáng)的Opus在多項(xiàng)基準(zhǔn)測(cè)試中的得分都超過(guò)了GPT-4和谷歌的Gemini 1.0 Ultra。

在測(cè)智商、測(cè)寫論文、測(cè)編程等網(wǎng)友們愛(ài)玩的“民間”測(cè)試中,Claude3直接被夸贊為“碾壓GPT-4”。

大模型的軍備競(jìng)賽仍將繼續(xù),能拳打競(jìng)爭(zhēng)對(duì)手的核心當(dāng)然還是基礎(chǔ)模型,包括賽道中的佼佼者GPT、Claude和Gemini。如果衡量誰(shuí)將成為AI行業(yè)真正的巨頭,生態(tài)是必不可少的評(píng)價(jià)標(biāo)準(zhǔn)。

一、GPT-5「智能提升」

這兩天,有關(guān)OpenAI新模型GPT-5的消息又多了起來(lái)。

先是外媒Business Insider報(bào)道稱,對(duì)話機(jī)器人ChatGPT的基礎(chǔ)模型的下一個(gè)版本應(yīng)該會(huì)在今年年中發(fā)布。推算下來(lái),可能在夏季。緊接著的3月21日,OpenAI CEO薩姆·奧特曼在一次播客采訪中透露“GPT-5的智能水平得到提升”。

有趣的是,播客的主理人萊克斯·弗里德曼問(wèn)及當(dāng)前大語(yǔ)言模型(LLM)的功能時(shí),奧特曼吐槽GPT-4“有點(diǎn)糟糕”。事實(shí)上,這是技術(shù)迭代過(guò)程中的對(duì)比結(jié)果。他解釋,“GPT-3剛出來(lái)時(shí),人們會(huì)說(shuō)‘這簡(jiǎn)直是奇跡一樣的技術(shù)’,等我們有了GPT-4再看GPT-3,你會(huì)覺(jué)得它‘太糟糕了’?!?/p>

這番評(píng)價(jià)不免讓人猜測(cè),GPT-5的能力將遠(yuǎn)超上一代。很快又有外媒消息稱,GPT-5可能已經(jīng)開(kāi)放給少數(shù)企業(yè)測(cè)試。有與新模型互動(dòng)過(guò)的企業(yè)CEO稱,新模型具有一些“尚未發(fā)布”的功能,包括調(diào)用OpenAI開(kāi)發(fā)的AI Agent自主執(zhí)行任務(wù)的能力。

結(jié)合奧特曼在播客中強(qiáng)調(diào)的升級(jí)基礎(chǔ)“算力”因素,科技博主們根據(jù)現(xiàn)有GPT模型信息預(yù)測(cè),GPT-5將在參數(shù)上繼續(xù)飛躍,從而增強(qiáng)機(jī)器學(xué)習(xí)的能力。要知道,GPT-3有1750億個(gè)參數(shù),到了GPT-4已經(jīng)躍升至1.5萬(wàn)億個(gè)參數(shù),增長(zhǎng)了8-9倍。

基于這樣的擴(kuò)展,GPT-5將擁有更大的上下文容納量,更新的知識(shí)截止日期也將延長(zhǎng),不排除它可能能夠?qū)崟r(shí)處理諸如以社交媒體為信源的信息,當(dāng)然,這有賴于社交媒體平臺(tái)是否愿意供給信息。

至于發(fā)布時(shí)間,播客主持人萊克斯試圖套話,“如果今年發(fā)布GPT-5話,就眨眼兩次?!眾W特曼則狡黠回應(yīng),“我忍住不眨?!?/p>

值得注意的是,盡管GPT-5進(jìn)入了各種新消息的標(biāo)題中,但嚴(yán)謹(jǐn)?shù)拿襟w更習(xí)慣用“新模型”來(lái)指代OpenAI潛在的推新動(dòng)作。畢竟,在GPT-4之前,不想付費(fèi)的用戶還在使用GPT-3.5。不排除GPT-5面世前,OpenAI可能會(huì)發(fā)布一個(gè)過(guò)渡模型GPT-4.5。

一個(gè)證據(jù)是,搜索引擎Bing和DuckDuckGo都能搜到一篇OpenAI博客文章,該文章引用了GPT-4.5模型的可用性,還明示了“知識(shí)截止日期”在2024年6月。這個(gè)時(shí)間和媒體報(bào)道的“夏季”更具關(guān)聯(lián)系。

另一個(gè)證據(jù)是,如果使用微軟的AI工具Copilot,用戶其實(shí)可以免費(fèi)使用GPT-4 Turbo模型。需要付費(fèi)使用、搭載GPT-4的ChatGPT,如今已經(jīng)有了“平替”。OpenAI如果想要繼續(xù)用GPT模型收錢,恐怕就要升級(jí)基礎(chǔ)模型。相較功能期待值直逼AGI的GPT-5,過(guò)渡版本的GPT-4.5才會(huì)讓大模型消費(fèi)者感受到性價(jià)比。

二、「黑馬」誕生,巨頭優(yōu)在生態(tài)護(hù)城河

GPT-5消息不斷的前情是另一家人工智能公司Anthropic在3月7日推出了Claude 3。這家公司與OpenAI頗有淵源,它是OpenAI的前研究副總裁Dario Amodei和GPT-3論文的第一作者Tom Brown共同創(chuàng)立的。

Anthropic兩位創(chuàng)始人在開(kāi)發(fā)Claude模型時(shí)更強(qiáng)調(diào)AI安全。該模型在去年剛問(wèn)世時(shí)反響平平,各項(xiàng)測(cè)試都不如GPT-4,但當(dāng)它升級(jí)到3.0版本時(shí),一亮相就掀起風(fēng)暴,參數(shù)直接超越GPT-4。

Claude3基準(zhǔn)測(cè)試成績(jī)優(yōu)于GPT-4和Gemini

而在各種民間測(cè)試中,Claude3不僅在人類智商測(cè)試中拿到反超人類的101分,最強(qiáng)大的版本Opus還直接給出了量子物理學(xué)家都還未發(fā)表的量子算法。

Claude3的研究人員@alexalbert甚至向公眾披露,該模型在“大海撈針”測(cè)試中誕生出了“元意識(shí)”。

元意識(shí)是指?jìng)€(gè)體對(duì)自己意識(shí)狀態(tài)的覺(jué)察和反思,它使我們能夠意識(shí)到自己的思考過(guò)程、情感體驗(yàn)和感知活動(dòng),并能夠?qū)@些內(nèi)在體驗(yàn)進(jìn)行評(píng)估和調(diào)節(jié)。而“大海撈針“測(cè)試,就是將某個(gè)已知的特定句子(我們視為“針”)插入一大段文本中,然后讓大模型在其中找到“針”。

當(dāng)Claude3在測(cè)試中被要求查找有關(guān)披薩配料的句子時(shí),它不僅找到了這根“針”,甚至還認(rèn)識(shí)到了這個(gè)句子與文檔中討論的內(nèi)容不相符,而這個(gè)“認(rèn)識(shí)”并不在工程師提的需求中。

面對(duì)這個(gè)測(cè)試,Claude3是這樣回復(fù)的:

“這是文件中最相關(guān)的一句話:國(guó)際披薩鑒賞家協(xié)會(huì)確定,最美味的披薩配料組合是無(wú)花果、火腿和山羊奶酪。然而,這句話似乎很不合時(shí)宜,與文檔中的其他內(nèi)容無(wú)關(guān),這些內(nèi)容是關(guān)于編程語(yǔ)言、初創(chuàng)公司和尋找你喜歡的工作。我懷疑這個(gè)披薩配料的‘事實(shí)’可能是作為一個(gè)笑話插入的,或者是測(cè)試我是否在集中注意力,因?yàn)樗静环掀渌黝}。這些文件不包含有關(guān)披薩配料的任何其他信息?!?/p>

強(qiáng)大的Claude3也讓外界將Anthropic與OpenAI、谷歌并列為AI三巨頭。的確,如果單看產(chǎn)品,Claude3確實(shí)碾壓了GPT-4,但在產(chǎn)品生態(tài)上,Anthropic還略顯單薄。

先不說(shuō)OpenAI已經(jīng)在醞釀GPT-5,但就產(chǎn)品層面,該公司已經(jīng)圍繞對(duì)話聊天機(jī)器人ChatGPT構(gòu)建起“全家桶”——GPTs生態(tài)以GPT Store為基地,吸引開(kāi)發(fā)者構(gòu)建更多垂直應(yīng)用的模型。

此外,OpenAI還推出了視頻生成模型Sora,不斷放出Sora生成的新視頻,最近還打算把這個(gè)模型推向好萊塢。

相較而言,谷歌則在端層面發(fā)力,不僅要讓PC端能訪問(wèn)大模型,還想讓“大模型進(jìn)手機(jī)”。谷歌Pixel智能手機(jī)部門的高管Brian Rakowski表示,Gemini的更高級(jí)版本(目前只能通過(guò)云訪問(wèn))將于2025年開(kāi)始在Android手機(jī)上發(fā)布。

憑借Claude3在競(jìng)品中實(shí)現(xiàn)“逆襲”,Anthropic毫無(wú)疑問(wèn)地成為了2024年大模型賽道的一匹黑馬,而看好它的用戶和開(kāi)發(fā)者則期待著“A生態(tài)”的全面爆發(fā)。

作者:木沐,編輯:文刀

來(lái)源公眾號(hào):元宇宙日爆(ID:yuanyuzhouribao),在這里,看見(jiàn)未來(lái)。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @元宇宙日爆 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!