谷歌急切迎戰(zhàn)ChatGPT,大模型之戰(zhàn)變數(shù)仍多
谷歌于近日推出了多模態(tài)大模型Gemini,并對(duì)其能力做出了高度評(píng)價(jià)。那么,在Gemini出現(xiàn)之后,如何解讀當(dāng)下的大模型競(jìng)爭(zhēng)呢?這篇文章里,作者給出了他的看法,一起來(lái)看一下吧。
沉寂一年后,谷歌帶著它的多模態(tài)大模型Gemini(雙子座)高調(diào)殺回AI圈。
此前,谷歌曾憑借AlphaGo在全球掀起了一波AI浪潮。但新一輪AI浪潮的風(fēng)頭卻被ChatGPT搶走,谷歌迫切需要一款現(xiàn)象級(jí)AI產(chǎn)品來(lái)證明自己的實(shí)力,這也就不難理解,為何谷歌要冒著風(fēng)險(xiǎn)在演示視頻中夸大自家大模型的性能。因?yàn)樗麄兲胱孏emini「看起來(lái)」優(yōu)于競(jìng)品了。
從命名也能看出,谷歌對(duì)Gemini的功能寄予了超越人腦的厚望。官方稱(chēng)Gemini是AI模型的巨大飛躍,其多項(xiàng)能力超過(guò)ChatGPT。自此,谷歌正式向競(jìng)爭(zhēng)對(duì)手OpenAI和微軟宣戰(zhàn),爭(zhēng)奪人工智能霸主地位。AI圈最強(qiáng)終于不再是ChatGPT的獨(dú)角戲。
01
最強(qiáng)大模型之戰(zhàn)硝煙正濃。
作為應(yīng)對(duì)ChatGPT-4的殺手锏,谷歌在發(fā)布會(huì)上稱(chēng)Gemini是其迄今為止規(guī)模最大、能力最強(qiáng)、最靈活的AI模型。不僅如此,谷歌稱(chēng)Gemini是自己從頭開(kāi)始構(gòu)建的多模態(tài)模型,更接近人類(lèi)認(rèn)識(shí)世界的方式。
不同于ChatGPT的逐步更新,谷歌一次性就發(fā)布了三種模式的Gemini,分別是Gemini Nano、Gemini Pro和Gemini Ultra。不同版本在性能上有著明顯差異,現(xiàn)在大家能用上的都是Gemini Pro,但在功能上能迎戰(zhàn)ChatGPT的是Gemini Ultra。
雖然宣傳視頻翻車(chē),但Gemini的數(shù)據(jù)表現(xiàn)還是相當(dāng)優(yōu)異。在運(yùn)算效能方面,Gemini幾乎“吊打”GPT-4。Gemini Ultra在32個(gè)多模態(tài)基準(zhǔn)測(cè)試中,其中30個(gè)測(cè)試集的性能超過(guò)當(dāng)前SOTA結(jié)果。在數(shù)學(xué)問(wèn)題、Python代碼任務(wù)、閱讀等方面,Gemini的性能都超過(guò)了此前最先進(jìn)的水平。
在純文本問(wèn)題上,Gemini是第一個(gè)在MMLU(大規(guī)模多任務(wù)語(yǔ)言理解)測(cè)評(píng)上超過(guò)人類(lèi)專(zhuān)家的模型。Gemini的得分為90%,人類(lèi)專(zhuān)家得分約為89%,而GPT-4在這類(lèi)問(wèn)題上的得分為86%;在多模式問(wèn)題上,Gemini得分為59%,GPT-4得分為57%,Gemini的表現(xiàn)均為最佳。
除了在常規(guī)能力上全面超越GPT-4,Gemini最大的特色是多模態(tài),也就是可以同時(shí)識(shí)別和理解文本、圖像、音頻、視頻和代碼五種信息,用戶(hù)可以交錯(cuò)添加文字、圖像、視頻等內(nèi)容,Gemini也可以輸出相應(yīng)交錯(cuò)的文本和圖像。從一開(kāi)始,Gemini就在不同模態(tài)上進(jìn)行預(yù)訓(xùn)練,再通過(guò)額外的多模態(tài)數(shù)據(jù)進(jìn)行微調(diào),這進(jìn)一步提升了模型的有效性。
02
搶跑就一定能將優(yōu)勢(shì)保持到最后嗎?答案可能是:未必。
對(duì)于剛起步的大模型行業(yè)來(lái)說(shuō),行業(yè)格局未定,后續(xù)的競(jìng)爭(zhēng)依然充滿(mǎn)變數(shù)。谷歌一開(kāi)始在AI領(lǐng)域遙遙領(lǐng)先,最后卻淪為OpenAI的追趕者;ChatGPT一出現(xiàn)便技驚四座,現(xiàn)如今又被Gemini趕超……這樣的故事在不斷上演。谷歌視頻里演示的多模態(tài)能力,實(shí)際上在一年內(nèi)就能實(shí)現(xiàn)。但一年時(shí)間里ChatGPT也會(huì)不停迭代,到時(shí)候Gemini還會(huì)是ChatGPT的對(duì)手嗎?
谷歌的野心絕不止步于追趕,而是希望全方位碾壓。Gemini的發(fā)布不僅是為了與ChatGPT一較高下,背后潛藏的是一個(gè)更大的項(xiàng)目。除了Gemini,谷歌還發(fā)布了迄今為止最強(qiáng)大、最高效,并且可擴(kuò)展的TPU系統(tǒng)——Cloud TPU v5p,專(zhuān)為訓(xùn)練尖端的AI模型而設(shè)計(jì)。新一代TPU將加速Gemini的發(fā)展,幫助開(kāi)發(fā)人員和企業(yè)客戶(hù)更快地訓(xùn)練大規(guī)模生成式AI模型,開(kāi)發(fā)出新產(chǎn)品和新功能。一個(gè)更可靠、可擴(kuò)展的訓(xùn)練模型和最高效的服務(wù)模型,才是谷歌做出Gemini的重要目標(biāo)。
這一戰(zhàn),谷歌布局深遠(yuǎn),奪回AI霸主的野心昭然若揭。面對(duì)已經(jīng)打出王炸的谷歌,對(duì)手OpenAI肯定不會(huì)坐以待斃,而OpenAI的絕招正是你根本猜不到它會(huì)出什么牌。最強(qiáng)大模型之爭(zhēng),槍聲已經(jīng)打響。
03
大模型的競(jìng)爭(zhēng)才剛開(kāi)始,國(guó)產(chǎn)同行們要加把勁了。
這一年來(lái),國(guó)內(nèi)發(fā)布比較知名的大模型有百度文心一言、阿里通義千問(wèn)、騰訊混元、科大訊飛星火、商湯商量、字節(jié)跳動(dòng)豆包、智譜AI-ChatGLM等。
表面上看各家大模型都各有優(yōu)勢(shì),但其實(shí)都還處于起步階段,算法上還未取得突破性的成果,和國(guó)外大模型相比還有一定差距,Gemini的出現(xiàn)或許可以加速行業(yè)內(nèi)的優(yōu)勝劣汰,讓大量沒(méi)有足夠競(jìng)爭(zhēng)力的產(chǎn)品加速出局,同時(shí),它也啟發(fā)了國(guó)產(chǎn)大模型:與其跟進(jìn)式研發(fā),不如將AI功能盡快賦能在已有的產(chǎn)品和服務(wù)之中,這樣反而成本更低、見(jiàn)效更快。
在大模型的競(jìng)賽中,頭部選手的經(jīng)驗(yàn)或多或少會(huì)被其他追趕者復(fù)用,這對(duì)后來(lái)者來(lái)說(shuō)是寶貴的學(xué)習(xí)機(jī)會(huì),只要保持住追趕的勢(shì)頭,就有超越的可能,這次是谷歌,下次又會(huì)是誰(shuí)呢?
作者:Lime
來(lái)源公眾號(hào):明晰野望(ID:MXYW-1688),銳眼看財(cái)經(jīng)野望大市場(chǎng)
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @明晰野望 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!