免費(fèi)的GPT-4o足夠強(qiáng),但治不好OpenAI的產(chǎn)品焦慮
最近,OpenAI召開了一場(chǎng)發(fā)布會(huì),推出了最新旗艦生成式AI模型GPT-4o。而從這次發(fā)布會(huì)的效果來看,GPT-4o或許會(huì)成為又一個(gè)成功的PR案例,被寫入OpenAI的歷史。
5月14日凌晨1點(diǎn),繼OpenAI在AI搜索上“虛晃一槍”之后,讓薩姆·奧爾特曼(Sam Altman)感覺“像魔術(shù)一樣”的新模型終于浮出水面。
不是GPT-5,不是AI搜索,而是最新旗艦生成式AI模型GPT-4o!
GPT-4o(“o”代表“omni”,意為“全能的”)是邁向更自然的人機(jī)交互的一步——它接受文本、音頻和圖像的任意組合作為輸入,并生成文本、音頻和圖像的任意組合輸出。
整場(chǎng)發(fā)布會(huì)時(shí)長(zhǎng)僅30分鐘,OpenAI CTO米拉·穆拉蒂(Muri Murati)帶來主題演講。“這是我們第一次在易用性方面真正邁出一大步?!?/strong>穆拉蒂在公司舊金山總部的現(xiàn)場(chǎng)演示中說道, “這種互動(dòng)變得更加自然,也更加容易。”
值得注意的是,此次發(fā)布會(huì)OpenAI CEO薩姆·奧爾特曼并未現(xiàn)身。在OpenAI官網(wǎng)披露的GPT-4o貢獻(xiàn)者中,依然沒有看到OpenAI首席科學(xué)家伊利亞·蘇茨克維爾(Ilya Sutskever)的身影。
一、“GPT-4o是我們最好的模型”
整場(chǎng)發(fā)布會(huì)的主角,就是OpenAI最新旗艦生成式AI模型GPT-4o。
OpenAI官網(wǎng)博客顯示,GPT-4o(“o”代表“omni”)是邁向更自然的人機(jī)交互的一步。它接受文本、音頻和圖像的任意組合作為輸入,并生成文本、音頻和圖像的任意組合輸出。
相比今年2月的Sora, OpenAI此次發(fā)布顯得更有誠(chéng)意——GPT-4o將免費(fèi)提供給所有用戶使用,Plus用戶則可以享受到5倍的調(diào)用額度。
穆拉蒂表示,GPT-4o將提供與GPT-4同等水平的智能。
同時(shí),GPT-4o的運(yùn)行速度大大提升,最大亮點(diǎn)在于其語(yǔ)音交互模式采用了全新技術(shù),讓聊天機(jī)器人對(duì)話的響應(yīng)速度大幅提升。OpenAI官網(wǎng)博客顯示,GPT-4o在談話中對(duì)音頻輸入的平均響應(yīng)時(shí)間為320毫秒,最短的響應(yīng)時(shí)間為232毫秒,與人類的響應(yīng)時(shí)間相似。
GPT-4o還有超高的“語(yǔ)言天賦”,能支持50種語(yǔ)言,并顯著提高了非英語(yǔ)語(yǔ)言的性能,包括改進(jìn)分詞器以更好地壓縮其中的許多語(yǔ)言:
根據(jù)傳統(tǒng)基準(zhǔn)測(cè)試,GPT-4o在文本、推理和編碼智能方面實(shí)現(xiàn)了GPT-4 Turbo級(jí)別的性能,同時(shí)在多語(yǔ)言、音頻和視覺功能上設(shè)置了新的高水位線。
開發(fā)人員現(xiàn)在可以在API中訪問GPT-4o。與GPT-4 Turbo相比,GPT-4o速度提高2倍,價(jià)格降低一半,速率限制提高5倍。
在現(xiàn)場(chǎng)演示環(huán)節(jié),GPT-4o更是展現(xiàn)了各類花式操作——它能根據(jù)演示者的實(shí)時(shí)要求變換語(yǔ)音語(yǔ)調(diào),演繹話?。荒軐?shí)時(shí)讀圖;甚至還跟演示者們開起玩笑,唱起歌。
此外,OpenAI還發(fā)布了桌面版的ChatGPT和新的用戶界面。
用戶可以向ChatGPT(由 GPT-4o 提供支持)提出問題,并在ChatGPT回答時(shí)打斷它。OpenAI表示,該模型提供“實(shí)時(shí)”響應(yīng)能力,甚至可以感知用戶聲音中的情感,從而生成“一系列不同情感風(fēng)格”的聲音(包括唱歌)。
GPT-4o還升級(jí)了ChatGPT的視覺能力。給定一張照片或一個(gè)桌面屏幕,GPT-4o可以快速回答相關(guān)問題,主題范圍包括“此軟件代碼中發(fā)生了什么?”到“這個(gè)人穿什么牌子的襯衫?”
“我們認(rèn)識(shí)到這些模型正變得越來越復(fù)雜,” 穆拉蒂說道,“但我們希望用戶與人工智能模型的交互體驗(yàn)?zāi)軌蚋幼匀?、輕松,讓用戶可以將注意力完全集中在與模型的協(xié)作上,而無需在意界面本身?!?/strong>
穆拉蒂還透露,未來幾周內(nèi),GPT-4o將分階段集成至OpenAI的各個(gè)產(chǎn)品之中,而且會(huì)在ChatGPT Plus中推出新版語(yǔ)音模式GPT-4o的alpha版。
OpenAI研究員威廉·費(fèi)達(dá)斯(William Fedus)表示:“GPT-4o是我們最先進(jìn)的新前沿模型。我們一直在LMSys arena上測(cè)試一個(gè)版本im-also-a-good-gpt2-chatbot?!?/p>
“這不僅是世界上最好的模型,而且可以在ChatGPT中免費(fèi)使用,這對(duì)于前沿模型來說是前所未有的?!?/strong>費(fèi)達(dá)斯補(bǔ)充道,“我們發(fā)現(xiàn)在更難的提示集上——特別是編碼——存在更大的差距:GPT-4o比我們之前的最佳模型實(shí)現(xiàn)了+100 ELO?!?/p>
奧爾特曼也在X上表示:“GPT-4o是我們最好的模型?!?/strong> OpenAI此次發(fā)布幾乎在想盡辦法“討好”用戶,在“交互體驗(yàn)”上下足了功夫,直接免費(fèi)開放使用更讓用戶感受到了OpenAI的誠(chéng)意。 但「甲子光年」發(fā)現(xiàn),在這種誠(chéng)意背后,這家已被捧上神壇的AI創(chuàng)業(yè)公司,正深陷于某種焦慮之中。 雖然奧爾特曼今天并未到場(chǎng),但5月11日,他便親自下場(chǎng)預(yù)告??墒?,翻翻評(píng)論區(qū),網(wǎng)友們的關(guān)注點(diǎn)似乎有點(diǎn)兒跑偏。 有人喊話奧爾特曼讓OpenAI首席科學(xué)家伊利亞回歸: 有人關(guān)心GPT-5到底何時(shí)發(fā)布: 伊利亞的去向和GPT-5的發(fā)布是OpenAI留給外界的兩大謎題,也是外界最關(guān)心的兩大問題。 2024年,人們對(duì)OpenAI最大的期待便是GPT-5。然而,每當(dāng)奧爾特曼在訪談中被問及GPT-5相關(guān)進(jìn)度時(shí),卻總是支支吾吾、諱莫如深。奧爾特曼在普羅大眾心中的畫像也逐漸從一位開天辟地的怪力少年,轉(zhuǎn)變?yōu)橐粋€(gè)在各國(guó)政客間長(zhǎng)袖善舞,在各種場(chǎng)合大打太極的“成熟企業(yè)家”。 更致命的是,ChatGPT和GPT-4之后,OpenAI似乎一直沒能推出相同重量級(jí)的AI產(chǎn)品,這些都在不斷消磨外界對(duì)OpenAI的期待與信心。 今年2月,OpenAI發(fā)布Sora——1份技術(shù)報(bào)告、32篇引用論文、一些畫面堪比電影鏡頭的demo和1個(gè)故作高深的“世界模擬器”概念就是OpenAI給出的全部,沒有技術(shù)論文,也沒有可公開體驗(yàn)的產(chǎn)品入口。 「甲子光年」曾向多位AI從業(yè)者提問:“ChatGPT和Sora,誰帶給你的震撼更大?”各位受訪人幾乎不約而同地回答:“Sora有震撼,但沒ChatGPT的震撼大?!?/strong> 造成這種感官差異的直接原因是,ChatGPT能直接體驗(yàn),但Sora不能。雖然ChatGPT也會(huì)犯一些荒唐的錯(cuò)誤,但真實(shí)的交流感帶給人們的震撼,遠(yuǎn)遠(yuǎn)大于只可遠(yuǎn)觀、不能上手體驗(yàn)的Sora。甚至不少聲音開始猜測(cè),Sora精美的Demo或許是工程師在背后屢次微調(diào)的結(jié)果,Sora實(shí)時(shí)交互的結(jié)果“可能遠(yuǎn)不如此”。 對(duì)于外界的猜測(cè)、質(zhì)疑,OpenAI并未回應(yīng),而是迅速扔出下一個(gè)“靶子”——AI搜索。 過去一周,外媒不斷有消息傳出OpenAI將推出AI搜索產(chǎn)品,更有媒體猜測(cè),谷歌一年一度的I/O大會(huì)即將于5月14日舉辦,而OpenAI此舉是針對(duì)谷歌的精準(zhǔn)狙擊。 OpenAI Search 測(cè)試界面,圖片來源:賽博禪心 不過,AI搜索的熱度炒了半天,所謂的AI搜索產(chǎn)品最終只是虛晃一槍。 昆侖萬維董事長(zhǎng)兼CEO方漢近期在一次直播中直言:“我覺得搜索引擎對(duì)于OpenAI的用戶增長(zhǎng)也不會(huì)有根本性的變化?!?/strong>有數(shù)據(jù)顯示,從去年5開始,ChatGPT的C端增長(zhǎng)便逐漸觸頂。 而產(chǎn)品焦慮一日不解,OpenAI距離“偉大的公司”就永遠(yuǎn)有一墻之隔。 今天再次復(fù)盤ChatGPT的成功會(huì)發(fā)現(xiàn),這是一次不可復(fù)現(xiàn)的“無心插柳”。 2022年中,OpenAI開始訓(xùn)練GPT-4。半年后的11月30日,OpenAI發(fā)布ChatGPT,全球各界都為之顫動(dòng)。 OpenAI內(nèi)部曾對(duì)是否發(fā)布ChatGPT有過很長(zhǎng)一段時(shí)間爭(zhēng)論,因?yàn)檎l都無法100%確認(rèn)這是正確的事情。 彼時(shí),OpenAI對(duì)自己的定位是一家為開發(fā)人員和企業(yè)構(gòu)建工具的公司,而非直接面向普羅大眾。因此,OpenAI要面臨的核心挑戰(zhàn),是ChatGPT的使用門檻是否足夠低,以至于能讓完全不懂技術(shù)的人用起來。 在此之前發(fā)布的視覺模型DaLL-E已經(jīng)讓OpenAI嘗到了甜頭。但ChatGPT能復(fù)制DALL-E的成功嗎? 奧爾特曼是名副其實(shí)的“冒險(xiǎn)派”,他鼓勵(lì)公司發(fā)布ChatGPT,“嘗試一下”。在他看來,用戶和模型進(jìn)行文本形式的交互會(huì)產(chǎn)生一些很重要的個(gè)性化結(jié)果。 很快,用戶的熱情證明,這次試驗(yàn)無比成功。從2022年11月上線的第一個(gè)完整月(2022年11月)開始,到12月這一數(shù)字達(dá)到了2.66億人次,月環(huán)比增長(zhǎng)了近75%。到2023年1月,總訪問量翻了一番多,達(dá)到6.16億人次,2月就首次突破10億人次大關(guān)。 這突如其來的成功,在OpenAI的意料之外。 “我們并沒有認(rèn)為GPT-3系列模型已經(jīng)跨越了將其應(yīng)用于消費(fèi)者或企業(yè)的門檻,本以為GPT-4會(huì)成為第一個(gè)跨越這道門檻的模型,所以我們的很多計(jì)劃和預(yù)測(cè)都是圍繞2023年3月發(fā)布GPT-4來安排的。”O(jiān)penAI COO 布拉德·萊特凱普(Brad Lightcap)此前在英偉達(dá)2024 GTC大會(huì)上分享道。 按照萊特凱普的說法,OpenAI用了6個(gè)月來適應(yīng)ChatGPT的爆炸性增長(zhǎng),并確保公司有足夠的GPU來滿足用戶的需求。 直到2023年后半年,OpenAI開始感受到了來自行業(yè)一線的真實(shí)需求。OpenAI曾公布,截止2023年8月,80%的財(cái)富500強(qiáng)公司已采用ChatGPT。80%的統(tǒng)計(jì)數(shù)據(jù)是指擁有注冊(cè)ChatGPT帳戶的財(cái)富500強(qiáng)公司的百分比,由與企業(yè)電子郵件域關(guān)聯(lián)的帳戶確定。 于是,OpenAI迅速行動(dòng)。2023年8月28日,OpenAI推出ChatGPT Enterprise,正式進(jìn)軍企業(yè)市場(chǎng)。它提供企業(yè)級(jí)安全和隱私、無限的高速GPT-4訪問、用于處理更長(zhǎng)輸入的更長(zhǎng)上下文窗口、高級(jí)數(shù)據(jù)分析功能、自定義選項(xiàng)等等。 這是一個(gè)很微妙的時(shí)間點(diǎn)——ChatGPT流量見頂,開始走下坡路。 根據(jù)第三方網(wǎng)站SimilarWeb的監(jiān)測(cè)數(shù)據(jù),2023年6月ChatGPT的網(wǎng)站與移動(dòng)客戶端的全球流量(PV)環(huán)比下降9.7%,美國(guó)地區(qū)的流量環(huán)比下降10.3%。同時(shí),ChatGPT的獨(dú)立訪客數(shù)量(UV)下降了5.7%,訪客在網(wǎng)站上花費(fèi)的時(shí)間也下降了8.5%。 這是自2022年11月30日發(fā)布以來,ChatGPT首次出現(xiàn)流量負(fù)增長(zhǎng)。其實(shí),ChatGPT增長(zhǎng)放緩的勢(shì)頭在2023年5月已經(jīng)出現(xiàn)端倪,5月的增長(zhǎng)率僅為2.8%。 當(dāng)時(shí),一家AI Lab負(fù)責(zé)人告訴「甲子光年」,ChatGPT流量下滑10%,但真正的挑戰(zhàn)不在這里。“大部分人都是帶著體驗(yàn)的目的,看看ChatGPT到底有多強(qiáng)大才去注冊(cè)的,包括我也是。但這不意味著我會(huì)天天用它。除了做一些簡(jiǎn)單的科普,或者給孩子寫作文之外,大部分人日常其實(shí)也不太會(huì)用到?!边@位AI Lab負(fù)責(zé)人說。 萊特凱普自己也在一次訪談中犀利點(diǎn)評(píng)ChatGPT:“人們玩兒過一會(huì)兒后就認(rèn)為它并不是真正的工具,而更像一個(gè)玩具?!?/strong> 更嚴(yán)峻的是,ChatGPT的燒錢速度同樣出人意料。 當(dāng)OpenAI的早期投資人埃隆·馬斯克(Elon Musk)問到ChatGPT的成本時(shí),奧爾特曼給到的數(shù)據(jù)是“每次對(duì)話的平均費(fèi)用為幾美分”。2023年4月,國(guó)外一位分析師估算的數(shù)據(jù)則是每天的運(yùn)營(yíng)成本高達(dá)70萬美元。 2023年2月1日,OpenAI開始商業(yè)化探索,推出付費(fèi)版本的ChatGPT Plus,定價(jià)每月20美元,提供的增值服務(wù)包括“高峰時(shí)段免排隊(duì)、快速響應(yīng)以及優(yōu)先獲得新功能”等。 如此看來,ChatGPT雖然備受喜愛,但在商業(yè)層面,卻算不上一個(gè)真正成功的產(chǎn)品。這些被ChatGPT燒掉的錢,就要用B端來填。 數(shù)據(jù)顯示,截至2023年11月,已經(jīng)有92%的500強(qiáng)企業(yè)以某種形式部署ChatGPT。Block、Canva、Carlyle、雅詩(shī)蘭黛、普華永道和Zapier均為OpenAI的早期客戶。 C端流量與B端客戶量的此消彼長(zhǎng)之間,OpenAI也逐漸由一家偉大而光榮的非營(yíng)利性AGI實(shí)驗(yàn)室,加速轉(zhuǎn)變?yōu)橐患摇捌接埂钡纳虡I(yè)公司——他們或許能賺到很多錢,卻沒有造出能夠說服用戶的產(chǎn)品。 直到今天,讓奧爾特曼感到“像魔術(shù)一樣”的GPT-4o面世。 只是GPT-4o真能治好OpenAI的產(chǎn)品焦慮嗎?答案或許并不清晰。 從模型能力上來看,實(shí)時(shí)語(yǔ)音交互是GPT-4o在多模態(tài)方面最亮眼的進(jìn)展。然而事實(shí)上,語(yǔ)音交互類產(chǎn)品并不新鮮。在可查閱的歷史中,AI語(yǔ)音交互類產(chǎn)品在商業(yè)化方面并沒有太多成功的案例,蘋果的Siri到今天都是一個(gè)十分雞肋的功能。 而發(fā)布會(huì)上的GPT-4o,看起來依然是一個(gè)“有趣的玩具”。 從“無心插柳”的ChatGPT,到“只可遠(yuǎn)觀”的Sora、“虛晃一槍”的SearchGPT,再到今天的GPT-4o,都只是OpenAI向世界展示其AI能力的“半成品”,而并非一個(gè)真正能夠說服用戶的商業(yè)產(chǎn)品,這在某種程度上限制了OpenAI用戶的增長(zhǎng)。 當(dāng)然,不可否認(rèn)的是,從這次發(fā)布會(huì)的效果來看,GPT-4o或許會(huì)成為又一個(gè)成功的PR案例,被寫入OpenAI的歷史。 作者:劉楊楠;編輯:王博 栗子 原文標(biāo)題:免費(fèi)的GPT-4o足夠強(qiáng),但治不好OpenAI的產(chǎn)品焦慮 | 甲子光年 來源公眾號(hào):甲子光年(ID:jazzyear),立足中國(guó)科技創(chuàng)新前沿陣地,動(dòng)態(tài)跟蹤頭部科技企業(yè)發(fā)展和傳統(tǒng)產(chǎn)業(yè)技術(shù)升級(jí)案例。 本文由人人都是產(chǎn)品經(jīng)理合作媒體 @甲子光年 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。 題圖來自Unsplash,基于CC0協(xié)議 該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。二、OpenAI的產(chǎn)品焦慮
三、GPT-4o能治好嗎?
- 目前還沒評(píng)論,等你發(fā)揮!