亚洲熟女AV天堂五月天，国产精品V欧美精品∨日韩蜜臀，国产无码精品一二三四区，深田咏美av一区二区，欧美丝袜中文更新，狠狠做五月深爱婷婷做完，欧美成人动漫综合一区二区三区，99久久精品少妇高潮喷水

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

千呼萬(wàn)喚始出來(lái)的 GPT 4.5，主打的只是一個(gè)“大”

硅星人

2025-03-03

0 評(píng)論 847 瀏覽 1 收藏

15 分鐘

GPT-4.5被定位為OpenAI迄今最大、知識(shí)最豐富的模型，但在多個(gè)基準(zhǔn)測(cè)試中，它已不再是性能最強(qiáng)的選手。本文將深入分析GPT-4.5的特點(diǎn)，包括其情商的提升、知識(shí)廣度與準(zhǔn)確性的增強(qiáng)，以及多場(chǎng)景實(shí)用性的優(yōu)化，并探討它在DeepSeek等競(jìng)爭(zhēng)對(duì)手崛起后的戰(zhàn)略意義。

“GPT系列不是我們前沿的模型?！?/p>

一個(gè)月前你還很難想象OpenAI發(fā)布GPT的下一個(gè)大版本更新時(shí)，會(huì)這樣說(shuō)自己。

但當(dāng)2月27日OpenAI突然用一個(gè)直播發(fā)布了GPT4.5的時(shí)候，一切都已經(jīng)發(fā)生變化。

GPT的定位不再是OpenAI用來(lái)震撼外界的模型，而是一個(gè)逐漸退到舞臺(tái)后方的“底座”；

它的發(fā)布也不再是OpenAI引導(dǎo)行業(yè)敘事的大動(dòng)作，而更多帶上了防御的感覺；

這是GPT目前“最大”的一款，也是它在舞臺(tái)中心的最后一舞。

OpenAI最初文檔里的表述，后已刪除。圖源：推特GPT4.5的亮點(diǎn)簡(jiǎn)單總結(jié)，在于“更大，更暖”——OpenAI迄今最大、知識(shí)最豐富的模型。

根據(jù)OpenAI的介紹，GPT-4.5在多個(gè)方面超過了GPT-4o及其他許多AI模型。例如，在OpenAI的SimpleQA基準(zhǔn)測(cè)試（該測(cè)試考察 AI 在處理簡(jiǎn)單、事實(shí)性問題時(shí)的準(zhǔn)確度）中，GPT-4.5的表現(xiàn)優(yōu)于GPT-4o和OpenAI的推理模型o1、o3-mini。

在測(cè)試編程能力的SWE-Bench Verified基準(zhǔn)測(cè)試上，它與GPT-4o和o3-mini表現(xiàn)相當(dāng)，但不如OpenAI的deep research和Anthropic的Claude 3.7 Sonnet。在AI生成完整軟件功能的能力上，它在SWE-Lancer上的表現(xiàn)超過了GPT-4o和o3-mini。

但與以往只會(huì)刷新榜單不同，這次OpenAI甚至在發(fā)布時(shí)就展示了自己在榜單中的差距——在一些學(xué)術(shù)基準(zhǔn)測(cè)試比如AIME和 GPQA上，GPT 4.5 在數(shù)學(xué)和科學(xué)相關(guān)問題上處于領(lǐng)先水平，但在其他多個(gè)維度的評(píng)測(cè)上，不及DeepSeek和Anthropic的模型。當(dāng)然，這么做還是因?yàn)?，它自身開發(fā)的新一代推定位不再是最強(qiáng)模型。基準(zhǔn)測(cè)試也就不再是GPT4.5想要對(duì)外呈現(xiàn)的重點(diǎn)。

根據(jù)OpenAI的直播發(fā)布，它的亮點(diǎn)在其他地方，總結(jié)起來(lái)如下：

更暖，更少幻覺

GPT-4.5最引人注目的特性是“情商”的顯著提升。

通過深度學(xué)習(xí)海量人類對(duì)話數(shù)據(jù)，它不僅能識(shí)別文本中的情緒（如憤怒、焦慮），還能解析情感背后的潛在需求，生成更具同理心的回應(yīng)。

例如，當(dāng)用戶抱怨“朋友總是爽約”時(shí)，GPT-4.5不再機(jī)械地輸出建議，而是優(yōu)先提供情感支持，再引導(dǎo)理性解決方案，甚至通過鼓勵(lì)性語(yǔ)言幫助用戶調(diào)整心態(tài)。這種能力源于對(duì)語(yǔ)境和情感細(xì)微差別的深度解構(gòu)，而非簡(jiǎn)單的關(guān)鍵詞匹配。

知識(shí)廣度與準(zhǔn)確性的提升

通過無(wú)監(jiān)督學(xué)習(xí)的規(guī)模化擴(kuò)展（據(jù)OpenAI研究員稱，它的預(yù)訓(xùn)練算力較GPT-4提升10倍，但這一點(diǎn)后來(lái)被官方從文檔中去掉了），GPT-4.5的世界知識(shí)覆蓋深度顯著增強(qiáng)。

例如，在回答“海水為何是咸的”這類問題時(shí)，它能提供結(jié)構(gòu)清晰、通俗易懂的解釋，并主動(dòng)補(bǔ)充科學(xué)不確定性，將“幻覺率”降至37.1%，遠(yuǎn)低于前代模型。

這種進(jìn)步不僅體現(xiàn)在知識(shí)量上，更在于對(duì)用戶意圖的精準(zhǔn)捕捉——例如，從“我需要減肥”中識(shí)別出隱含的健康管理需求，而非單純推薦食譜。

多場(chǎng)景實(shí)用性的優(yōu)化

GPT-4.5在寫作、編程和日常問題解決中展現(xiàn)出更強(qiáng)的上下文連貫性。它可輔助生成創(chuàng)意文案、修復(fù)代碼漏洞，甚至通過聯(lián)網(wǎng)檢索實(shí)時(shí)信息。

盡管在數(shù)學(xué)和編程等深度推理任務(wù)中提升有限（代碼能力僅提升7%-10%），但其在依賴世界知識(shí)和創(chuàng)造力的領(lǐng)域（如設(shè)計(jì)、教育咨詢）表現(xiàn)卓越。此外，多語(yǔ)言支持?jǐn)U展至14種，低資源語(yǔ)言（如斯瓦希里語(yǔ)）的表現(xiàn)顯著提升，進(jìn)一步打破語(yǔ)言壁壘。

而在訓(xùn)練方面，OpenAI也強(qiáng)調(diào)了它訓(xùn)練方法的高效率和更大規(guī)模。他們使用了低精度訓(xùn)練，以及提升了跨數(shù)據(jù)中心的訓(xùn)練資源使用效率。

以上這些種種特點(diǎn)都難免讓人想到DeepSeek。

作為一個(gè)強(qiáng)調(diào)邏輯推理能力的模型，DeepSeek R1卻在文字表達(dá)上讓人驚喜。而作為一個(gè)“知識(shí)型”模型，GPT4.5開始強(qiáng)調(diào)它的情感能力；

在訓(xùn)練上，GPT4.5“激進(jìn)地”使用了低精度訓(xùn)練，而這幾乎就是deepseek最初公布V3時(shí)引發(fā)外界震動(dòng)的絕活之一；

OpenAI為了讓GPT4.5“變大”，在預(yù)訓(xùn)練階段使用了跨多個(gè)數(shù)據(jù)中心的計(jì)算設(shè)施來(lái)實(shí)現(xiàn)擴(kuò)展，這也讓人想到DeepSeek“起家”的技術(shù)，關(guān)于它自建的螢火集群的一系列跨數(shù)據(jù)中心的研究論文。

OpenAI稱GPT-4.5會(huì)成為未來(lái)推理模型的基礎(chǔ)模型，這也是V3與R1的關(guān)系。

在DeepSeek開源之前，OpenAI的口徑還是GPT系列和o系列是兩個(gè)不同系列的模型，而DeepSeek的詳細(xì)論文解釋了基座模型與推理模型的關(guān)系，并自然把競(jìng)爭(zhēng)引向了OpenAI和Anthropic最近兩個(gè)模型所體現(xiàn)出的模型融合的路線上。

API非常貴當(dāng)我們停下來(lái)看看，這一切的變化還是很神奇的：

一個(gè)月之前這一切都不會(huì)這樣發(fā)生，現(xiàn)在每一個(gè)AI領(lǐng)域的重要?jiǎng)幼鳎级嗌倩\罩在DeepSeek“陰影”之下。

甚至所有跡象都在顯示這是一個(gè)OpenAI計(jì)劃外發(fā)布的模型，它不能太強(qiáng)，超過它主打的o3，但它又必須發(fā)布，因?yàn)镈eepSeek帶來(lái)的這一波開源沖擊，人人都知道了GPT系列和o系列的緊密關(guān)系，它需要證明它在基礎(chǔ)模型上的進(jìn)展，而不能只是用o系列來(lái)震撼大家了。

OpenAI這次發(fā)布繼續(xù)“做實(shí)”了很多事情，比如曾經(jīng)依賴數(shù)據(jù)和計(jì)算能力的擴(kuò)展所帶來(lái)的GPT系列的能力增強(qiáng)，正式結(jié)束了；它帶來(lái)的o系列的計(jì)算時(shí)間擴(kuò)展定律，正式成為接下來(lái)的行業(yè)主題；而GPT系列的意義從最前端的直接參與競(jìng)爭(zhēng)的角色，變成比拼推理模型時(shí)的重要支撐。

GPT正式淡出了舞臺(tái)中央，只屬于它的時(shí)代結(jié)束了，接下來(lái)正式進(jìn)入群雄競(jìng)爭(zhēng)的推理時(shí)代。

作者｜王兆洋

本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】，微信公眾號(hào)：【硅星人Pro】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App