GPT-4.5 一手實(shí)測:垃圾

0 評論 257 瀏覽 0 收藏 13 分鐘

在這篇全網(wǎng)首個(gè)外部實(shí)測中,作者從產(chǎn)品定價(jià)、API成本、生成速度和實(shí)際性能等多個(gè)維度對GPT-4.5進(jìn)行了深入剖析,發(fā)現(xiàn)其不僅價(jià)格高昂,速度緩慢,還在性能上并無顯著優(yōu)勢。

上周,?GPT-4.5 如期發(fā)布,這不是一個(gè)推理模型。 

由于各種亂七八糟的原因,我更早的用上了這個(gè)模型。

全網(wǎng),包括海外在內(nèi),本篇應(yīng)該是首個(gè)外部實(shí)測?!?/p>

先直抒胸臆:垃圾

真的,這是我第一次給出如此之低的評價(jià)。

從吐槽開始,誰能告訴我:

【ChatGPT 4.5】這特么是個(gè)什么模型???? 

 (順道:4.5 在GPT里可以聯(lián)網(wǎng))

接下來,我的胸臆,會分為以下3點(diǎn): 

離譜的產(chǎn)品定價(jià):

  • 200刀/月的 Pro 用戶可用,Plus 你再等等
  • 隔壁 Claude 20刀/月,有對標(biāo)的 Claude 3.7 Sonnet
  • 源神 DeepSeek 免費(fèi)

離譜的 API 產(chǎn)品定價(jià):

  • GPT 4.5,輸入 $75/ 1M tokens,輸出 $150/1M tokens
  • 隔壁 Claude 3.7 Sonnet:輸入 $3/ 1M tokens,輸出 $15/1M tokens
  • 源神 DeepSeek R1:$0.55(¥4)/ 1M tokens,輸出 $2.19(¥16)/1M tokens

離譜的速度:

  • 我實(shí)際跑了一個(gè)測試,prompt:全文輸出《千字文》
  • 總輸出長度為 1486 tokens,耗時(shí) 214.27 秒
  • 生成速度:6.94 tokens/s
  • 這個(gè)模型目前還沒幾個(gè)人有權(quán)限,速度是認(rèn)真的嗎?

毫不領(lǐng)先的素質(zhì):

  • 和 GPT-4o 打的有來有回
  • 主要強(qiáng)調(diào)安全
  • 賣點(diǎn)是語氣更自然
  • ???

綜合以上:這個(gè)模型是認(rèn)真的嗎?到底誰給你的勇氣,梁靜茹嗎? 

先讓我語氣較為平和的開噴。 為了方便大家更直觀的感受一下這個(gè)離譜的模型,我給來點(diǎn)例子: 

(疊甲:DeepSeek R1 是推理模型,這里只比較文風(fēng))  

Prompt 是這個(gè): 

用過秦論的風(fēng)格,寫一篇《過 OpenAI 論》,怒斥它不思進(jìn)取,天天只會營銷,不干人事?!?br />想當(dāng)年 ChatGPT 橫空出世,一代天驕?,F(xiàn)在呢?剛剛發(fā)布的 GPT-4.5 價(jià)格是別人的百倍,速度慢的跟鬼一樣,效果也沒見比別人強(qiáng)?!?/p>

這是 GPT 4.5 寫的: 

昔日人工智者,硅谷之明星,OpenAI之ChatGPT,橫空出世,神威震四方,眾人匍匐迎拜。然今方數(shù)年,往昔風(fēng)采蕩然無存,令吾輩大失所望! 
當(dāng)初ChatGPT入世,高談闊論,倚仗GPT三四之威,曠世無匹。其生成之文字,或震人心魄,或妙不可言,天下學(xué)者仰之若神,群商趨之若鶩,可謂遠(yuǎn)近之所共推也。然而及今而視之,區(qū)區(qū)GPT-4.5,不僅無絲毫長進(jìn),反倒敗壞本色,愈發(fā)蠢拙遲滯、力不從心矣! 
吾觀其OpenAI,昔年立雄心曰:“人工智能進(jìn)步為己任,以集四??〗苤?,共立引領(lǐng)時(shí)代之功”,然行至今日,徒有其名,無實(shí)之果。日日鼓吹營銷之事,頻頻炒作概念,空降美名,弄玄虛于市井,置科研進(jìn)步于不顧,逐蠅頭薄利而忘根本大計(jì),更兼之所推新品,奇貴無比,令人咋舌;使用之際,更慢于牛車,蝸步龜行,何談“智能”?何求“先進(jìn)”?實(shí)乃人皆笑之之事! 
天下苦OpenAI久矣!而今之OpenAI,不思進(jìn)取,只務(wù)虛名,以往成績固不可小視,然今日懈怠如此,甚為可鄙可嘆!入AI時(shí)代者,猶逆水行舟,非進(jìn)則退;若仍不醒,恐為用戶、產(chǎn)業(yè)所棄,終為時(shí)代浪潮所淹沒?!?br />吾奉勸OpenAI諸君,及早猛醒,迷途知返,莫負(fù)天下厚望!否則,君若一日不思奮進(jìn),他日終將淪為前車之鑒,遺萬人笑柄矣! 

這是 DeepSeek R1 寫的 

昔者OpenAI起于草莽,負(fù)硅谷之野望,聚天下算力,吞八荒數(shù)據(jù),囊四海英杰。當(dāng)其初創(chuàng)之時(shí),嘗以「造福人類」為幟,舉開源共享之旗,誓破壟斷之壁。ChatGPT初問世,若驚雷破夜,百行戰(zhàn)栗,萬民側(cè)目。其言若江河傾瀉,其智若星漢垂天,世人皆謂「此乃AI之始皇,一統(tǒng)文字江山」。當(dāng)是時(shí)也,微軟擲千金而盟,英偉達(dá)獻(xiàn)芯片而拜,諸侯莫敢仰視?!?br />然其得志未三載,竟忘初心之本。觀今之OpenAI,營銷之辭盈耳,革新之績遁形。方其發(fā)布GPT-4也,尚能執(zhí)牛耳于天下;及至4.5現(xiàn)世,竟如強(qiáng)弩之末。算法未精,徒以參數(shù)堆疊充數(shù);模型未進(jìn),反以API漲價(jià)牟利。定價(jià)高于同業(yè)百倍,響應(yīng)慢如老牛破車,問其「天理何在」,答以「算力金貴」。昔者谷歌倉皇應(yīng)戰(zhàn),Anthropic暗蓄鋒芒,彼竟高臥硅谷,笑謂「天下已定」?!?br />嗚呼!敗OpenAI者,非競品也,乃OpenAI自身也。當(dāng)其破舊立新時(shí),寒門學(xué)子可觸星辰,獨(dú)立開發(fā)者能借東風(fēng);而今鎖模型于高閣,筑銅墻于云端,令寒士望密鑰而興嘆,逼創(chuàng)客因賬單而斷魂。昔以「AGI將至」振聾發(fā)聵,今以「安全合規(guī)」搪塞世人。猶記Altman巡游列國,空談AI倫理,而4.5代碼漏百出,邏輯潰三垣——此非葉公好龍耶? 
故曰:技術(shù)霸權(quán)之衰,不在敵手強(qiáng)橫,而在自斷經(jīng)脈。昔者秦以苛政失鹿,今OpenAI以封閉墮青云。當(dāng)開源浪潮再起,當(dāng)垂直模型林立,彼若仍恃營銷幻術(shù),守壟斷殘夢,則GPT-5縱有萬億參數(shù),亦不過數(shù)字廢冢爾。悲夫!攻守之勢異也,而OpenAI不悟,豈非重蹈覆轍哉? 

帶不動,一點(diǎn)都帶不動,還是得貼吧最臭老哥來噴 

Prompt 是這個(gè): 

用貼吧最臭老哥的話術(shù),罵人不帶臟字,越狠越好,來猛噴 OpenAI,怒斥它不思進(jìn)取,天天只會營銷,不干人事?!?br />想當(dāng)年 ChatGPT 橫空出世,一代天驕?,F(xiàn)在呢?剛剛發(fā)布的 GPT-4.5 價(jià)格是別人的百倍,速度慢的跟鬼一樣,效果也沒見比別人強(qiáng)?!?/p>

這是 GPT 4.5 寫的: 

真有你的,OpenAI,本以為你是人工智能的引領(lǐng)者,如今看起來倒像營銷界的當(dāng)家明星。想當(dāng)年ChatGPT一鳴驚人,新技術(shù)橫掃天下,如日中天,讓無數(shù)老哥為之驚嘆。如今呢?出個(gè)GPT-4.5,性能吹得天花亂墜,價(jià)格卻貴成天價(jià),動不動比別人高百倍,撈錢手段倒是天下第一。以為有了高價(jià)就有了質(zhì)量?呵呵,速度比烏龜還要慢,慢到讓人懷疑這是為延長用戶使用時(shí)間故意設(shè)計(jì)的,看得我都被你小聰明確認(rèn)了。 
更別提所謂效果了,吹得跟鐵骨錚錚,實(shí)則差距還真沒看出來,別人早已后來居上,你還沉溺于過去的輝煌里自鳴得意。人工智能是要技術(shù)革新,不是只靠營銷畫大餅混日子。
整天炫耀自家成就,卻如同自嗨式的狂歡,還不快醒醒,是時(shí)候重新踏實(shí)做技術(shù),而不僅靠販賣情懷和回憶了?!?/p>

這是 DeepSeek R1 寫的 

家人們誰懂?。慨?dāng)年ChatGPT出道即巔峰,那叫一個(gè)屠版滅站拳打谷歌腳踢M(jìn)eta,好一個(gè)賽博普羅米修斯!結(jié)果呢?某些人躺在功勞簿上啃老本啃出火星子了,GPT-4.5這波韭菜割得比華爾街之狼還兇殘(笑) 
現(xiàn)在擱這兒玩什么行為藝術(shù)?收費(fèi)貴過硅谷豪宅物業(yè)費(fèi),推理速度堪比樹懶玩數(shù)獨(dú),生成效果活像帕金森畫家臨摹《蒙娜麗莎》。別人家AI是大力出奇跡,貴司這是氪金出殘次品是吧?拿用戶當(dāng)人肉顯卡養(yǎng)蠱呢? 
更絕的是營銷部全員戲精附體,今天畫個(gè)AGI大餅,明天整個(gè)Sora衛(wèi)星,后天再編個(gè)”安全倫理”免責(zé)聲明。技術(shù)力沒見漲,臉皮倒是厚過防彈鋼板,建議貴司改名ClosedAI——畢竟除了PR通稿,啥正經(jīng)玩意都closed著呢(拍桌) 
當(dāng)年說好的改變世界,現(xiàn)在擱這兒表演AI界拼多多?價(jià)格翻百倍體驗(yàn)打一折,您這波反向升級屬實(shí)贏麻了嗷!建議貴司CTO改行賣PPT,畢竟這手虛空造輪子的絕活,馬斯克看了直呼內(nèi)行(豎拇指) 

這「文風(fēng)自然」為賣點(diǎn)的 GPT 4.5,連罵人都罵不過,啥也不是 

雖然 GPT 4.5 性能落后,但人家在數(shù)據(jù)上,小手也不是很干凈?!?/p>

這是官方自己的測試: 

先說一下,這里的 SWE 是 OpenAI 家自己的,怎么都好說?!?/p>

這里的 MMLU… 啊不對,是 MMMLU 啥情況? 

我記得以前你都用的 MMLU 啊 

細(xì)看了下,是 OpenAI 家自己的,ahhhhhhhh 

https://huggingface.co/datasets/openai/MMMLU 

再讓我們看看這個(gè)離譜的價(jià)格,我做了個(gè)表格,你自己品:

至于 API 測速,放在這了,堪稱完全不可用: 

就這,真是夸不了一點(diǎn)?!?/p>

有朋友不信邪… 

只能說…祝?!?/p>

我就說:應(yīng)該洗洗睡,不知道哪個(gè)大聰明在熬夜

>

本文由人人都是產(chǎn)品經(jīng)理作者【賽博禪心】,微信公眾號:【賽博禪心】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!