日本不卡在线，四虎日韩久久，亚洲最新无码中文字幕一区，97久久婷婷国产综合亚洲，欧美成人精品第一区二区，国产精品露脸无码视频，国产一级片内射视频播，啊啊无码高清在线视频

搜索

APP

起點(diǎn)課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

狙擊谷歌？示好蘋果？OpenAI推出GPT-4o背后的遐想

科技旋渦

2024-05-14

0 評論 1545 瀏覽 1 收藏

12 分鐘

今天凌晨，OpenAI在線上發(fā)布了最新旗艦大模型GPT-4o。這篇文章，我們來聊下，為什么是GPT-4o而不是GPT5，以及，為什么是現(xiàn)在發(fā)布？

北京時(shí)間5月14日凌晨，OpenAI在線上舉辦了“春季更新”活動，他們推出最新旗艦大模型GPT-4o，不僅免費(fèi)可用，能力更是橫跨聽、看、說，絲滑流暢毫無延遲，就像在打一個視頻電話。

那么，GPT-4o還具備怎樣的能力？為什么這次發(fā)布的是GPT-4o而不是GPT-5？OpenAI為什么會在谷歌I/O大會前發(fā)布該產(chǎn)品？我們看看能不能在這次活動中找到答案。

一、GPT-4o有什么不一樣?

此次發(fā)布，GPT-4o最大的特點(diǎn)是增加了語音交互，并且號稱和一些同類競品相比，它的響應(yīng)時(shí)間更快，可以減少延時(shí)，更接近和真人對話的節(jié)奏。

在GPT-4o之前，用戶使用語音模式與ChatGPT對話時(shí)，GPT-3.5的平均延遲為2.8秒，GPT-4為5.4秒，音頻在輸入時(shí)還會由于處理方式丟失大量信息，讓GPT-4無法直接觀察音調(diào)、說話的人和背景噪音，也無法輸出笑聲、歌唱聲和表達(dá)情感。

與之相比，GPT-4o可以在232毫秒內(nèi)對音頻輸入作出反應(yīng)，與人類在對話中的反應(yīng)時(shí)間相近。在錄播視頻中，兩位高管作出了演示：機(jī)器人能夠從急促的喘氣聲中理解“緊張”的含義，并且指導(dǎo)他進(jìn)行深呼吸，還可以根據(jù)用戶要求變換語調(diào)。

據(jù)OpenAI官網(wǎng)介紹，GPT-4o中的o代表omni(譯為全能)，稱它向更自然的人機(jī)交互邁進(jìn)了一步，因?yàn)樗邮芪谋?、音頻和圖像的任意組合作為輸入內(nèi)容，并生成文本、音頻和圖像的任意組合輸出內(nèi)容。

OpenAI技術(shù)負(fù)責(zé)人穆拉迪(Mira Murati)在直播活動中表示，新型號GPT-4o“速度快得多”，在文本、視頻和音頻方面都有改進(jìn)，公司最終計(jì)劃讓用戶與ChatGPT進(jìn)行視頻聊天?！斑@是我們第一次在易用性方面邁出巨大的一步。”

值得注意的是，新模型允許ChatGPT處理50種不同的語言，速度和質(zhì)量都有所提高，它還將通過OpenAI的API提供支持，這樣開發(fā)者今天就可以開始使用新模型構(gòu)建應(yīng)用程序了。GPT-4o的速度是GPT-4 Turbo的兩倍，成本只有一半。

從性能來看，OpenAI表示，在傳統(tǒng)基準(zhǔn)測試中，GPT-4o在文本、推理和代碼智能方面達(dá)到了GPT-4 Turbo級的性能，同時(shí)在多語言、音頻和視覺能力方面達(dá)到了新高度。它在英文文本和代碼上的性能與GPT-4 Turbo相當(dāng)，在非英文文本上有顯著改善。

此外，通過過濾訓(xùn)練數(shù)據(jù)和訓(xùn)練后改進(jìn)模型行為等技術(shù)，GPT-4o在設(shè)計(jì)中內(nèi)置了跨模式的安全性，并創(chuàng)建了新的安全系統(tǒng)，為語音輸出提供護(hù)欄。GPT-4o還與來自社會心理學(xué)、偏見和公平、錯誤信息等領(lǐng)域的七十多名外部專家開展廣泛的外部團(tuán)隊(duì)合作，以識別新增加的模式引入或放大的風(fēng)險(xiǎn)，提高與GPT-4o互動的安全性。

值得一提的是，OpenAI不僅將GPT-4o直接提供給用戶使用，還將其作為API開放給開發(fā)者。這意味著開發(fā)者可以方便地利用GPT-4o的強(qiáng)大功能來構(gòu)建自己的應(yīng)用程序，從而在開發(fā)速度、成本控制以及功能實(shí)現(xiàn)等方面獲得顯著提升。

而且，OpenAI竟然直接將這個模型免費(fèi)開放給用戶使用了。

元宇宙新聲認(rèn)為，語音能力再度提升，將使得GPT-4o有希望打破人與機(jī)器交互的“天花板”，未來的ChatGPT，可以無處不在——比如，它可以隨時(shí)隨地出現(xiàn)在人的身邊、可以嵌入到?jīng)]有屏幕的設(shè)備上與人交談?？傊珿PT-4o可以讓人們更專注于與ChatGPT的協(xié)作，而不是受限于屏幕界面本身。

這個時(shí)間點(diǎn)放出GPT-4o，是狙擊谷歌還是示好蘋果?

相信OpenAI在這個時(shí)間點(diǎn)放出GPT-4o是有理由的，最直觀的體現(xiàn)就是，在其活動的后一天谷歌就將舉辦2024年I/O開發(fā)者大會，這次OpenAI再次精準(zhǔn)狙擊谷歌。如果谷歌I/O大會上沒有驚人的發(fā)布，也許這次風(fēng)頭又會被OpenAI搶走。

從歷史上來看，OpenAI每一次產(chǎn)品發(fā)布的時(shí)間都拿捏得非常準(zhǔn)確。2024年2月15日，谷歌對外重磅發(fā)布了多模態(tài)大模型Gemini 1.5 Pro，官方測試結(jié)果顯示，這個最高支持100萬tokens的多模態(tài)大模型，性能遠(yuǎn)超GPT-4 Turbo。

然而，就在同一天，OpenAI發(fā)布了文生視頻大模型Sora。

Sora的發(fā)布讓全網(wǎng)關(guān)注度再次聚焦到了OpenAI這一文生視頻產(chǎn)品上，搶走了本應(yīng)屬于谷歌的高光時(shí)刻，也讓谷歌Gemini 1.5 Pro在大模型發(fā)展歷史上的意義再次被低估。

其實(shí)現(xiàn)在回頭看，Sora的發(fā)布這是一場徹頭徹尾的“表演”項(xiàng)目，因?yàn)榈侥壳盀橹?，Sora還是沒有開放給公眾使用。

除了狙擊谷歌外，我們發(fā)現(xiàn)在OpenAI這次活動中全程用iPhone和MacBook Pro進(jìn)行演示，同時(shí)還發(fā)布了Mac桌面版的ChatGPT，這讓我們不得不懷疑，他們是不是在為與蘋果的合作在鋪路?

近日，有消息爆出，蘋果公司與OpenAI敲定一項(xiàng)協(xié)議，今年將后者的部分技術(shù)引入iPhone。借此蘋果將能提供由ChatGPT支持的“聊天機(jī)器人”，作為iOS 18中人工智能功能的一部分。

事實(shí)上，面對激烈的AI技術(shù)角逐，蘋果與OpenAI的合作使人們有理由期待一個更加智能、更加互動的Siri，對于蘋果來說，這可能也是鞏固其在全球科技領(lǐng)域領(lǐng)導(dǎo)地位的重要一步。

元宇宙新聲認(rèn)為，這次OpenAI推出GPT-4o時(shí)再次向大家印證了他們的營銷思維，既給競爭對手谷歌制造了壓力，又向潛在合作伙伴蘋果示好。但需要注意的是，谷歌的風(fēng)頭并不容易被搶走，反而有可能被其反噬，而蘋果也絕不是一家長期依靠其他廠商生存的企業(yè)，OpenAI在最大賣點(diǎn)還是產(chǎn)品，比如傳說中的“GPT-5”。

二、為什么是GPT-4o不是GPT-5

在人們感嘆于GPT-4o進(jìn)一步提升大模型能力的時(shí)候，不禁要問，傳說中的GPT-5怎么沒有推出?它現(xiàn)在研發(fā)到什么進(jìn)度了?

我們認(rèn)為，之所以現(xiàn)階段發(fā)布GPT-4o，是因?yàn)镚PT-5的研發(fā)肯定遇到了一些問題。如果不是這樣，OpenAI直接推出GPT-5就好了。一家科技企業(yè)發(fā)布新產(chǎn)品一定是越早越好，尤其在大模型這一領(lǐng)域中，各家的競爭非常激烈。因此，OpenAI在研發(fā)GPT-5時(shí)，不是有性能方面的危機(jī)就是有成本的問題。

但以大家對OpenAI的理解，即使成本再高，只要效果足夠驚艷，它一定會推出的，先震懾一下行業(yè)，哪怕GPT-5一天就能用3條，也希望吸引到所有人的目光。所以，我們認(rèn)為GPT-5的研發(fā)過程中可能還是遇到的性能或者安全問題會更多一些。

其實(shí)不止我們，網(wǎng)友們也在線紛紛催OpenAI，快點(diǎn)發(fā)GPT-5。

在此前的采訪中，OpenAI首席執(zhí)行官Sam Altman也回答了關(guān)于GPT-5的問題，他表示：“關(guān)于GPT-5的發(fā)布時(shí)間，目前我們還沒有確定一個具體的日期。我們對新模型的推出持謹(jǐn)慎態(tài)度，致力于確保它在發(fā)布時(shí)能夠達(dá)到我們的高標(biāo)準(zhǔn)。我們正在考慮采用一種新的發(fā)布策略，這可能與以往的方式有所不同。我們對于GPT-5的命名和發(fā)布策略仍在討論之中，但可以肯定的是，我們致力于讓這款新模型在發(fā)布時(shí)能夠?yàn)橛脩魩碜吭降捏w驗(yàn)?！?/p>

元宇宙新聲認(rèn)為，在發(fā)展過程中，OpenAI肯定會遇到不少挑戰(zhàn)。但，我們希望他們始終保持著堅(jiān)定的信念和持續(xù)的創(chuàng)新精神，不斷突破自我，實(shí)現(xiàn)全球AI領(lǐng)軍企業(yè)的期望。特別是在GPT系列模型的推出上，OpenAI更是引領(lǐng)了AI領(lǐng)域的新一輪技術(shù)革命。

三、寫在最后

在人工智能領(lǐng)域，每一次技術(shù)的飛躍都標(biāo)志著人類智慧與機(jī)器智能的深度融合。GPT-4o作為OpenAI的最新旗艦?zāi)Ｐ?，無疑在技術(shù)層面取得了顯著的進(jìn)步。其新加入的音頻理解能力以及對易用性的重視，確實(shí)為用戶提供了更為自然、便捷的交互體驗(yàn)。

當(dāng)前的發(fā)展中，OpenAI依然面臨著更多的機(jī)遇和挑戰(zhàn)。然而，公司始終保持著堅(jiān)定的信念和持續(xù)的創(chuàng)新精神，在未來的AI領(lǐng)域中，OpenAI將繼續(xù)發(fā)揮引領(lǐng)作用，為人類社會的進(jìn)步貢獻(xiàn)更多力量。

作者：賈桂鵬；公眾號：元宇宙新聲

本文由 @元宇宙新聲授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App