國產(chǎn)AI大模型猛打價格戰(zhàn),但從業(yè)者表示沒什么用,純噱頭
進(jìn)入5月,國內(nèi)大廠的大模型紛紛降價吸引用戶;但 AI 世界瞬息萬變,或許再過一段時間,這場價格風(fēng)波會迭代成新的戰(zhàn)斗方式。這篇文章,我們和作者一起,看看這場大模型降價背后的原因,以及可能的后續(xù)。
這個 5 月,國內(nèi)大廠的大模型也開始爭 “ 地板價 ” 了。
5 月 15 日,字節(jié)跳動的豆包大模型發(fā)布,定價 0.0008 元/千Tokens。
21 日,阿里通義千問 GPT-4 級主力模型 Qween-Long 降價 97%,API 輸入價格從 0.02 元/千Tokens 降至 0.0005 元/千Tokens,每千 Tokens 比豆包便宜 0.3 厘。
同天,百度的文心大模型中的兩大主力模型 ERNIE Speed 和 ERNIE Lite 直接宣布免費。
22 日,騰訊也跟進(jìn)了降價風(fēng)潮,旗下數(shù)款大模型降價 50%-87.5% 不等,有三款大模型直接免費。
似乎,中文互聯(lián)網(wǎng)世界的任何事物都要經(jīng)歷一波價格主導(dǎo)的 “ 百團(tuán)大戰(zhàn) ”。
國產(chǎn)大模型價格普降,理論上并不意外,畢竟要全面鋪開市場,利用冗余產(chǎn)能,低價和免費是最直接有效的方式。
但同時,在行業(yè)人士看來,降價這件事經(jīng)不起細(xì)琢磨,無論是長遠(yuǎn)效益,還是眼下國產(chǎn)大模型的技術(shù)水平,這場價格戰(zhàn)來得都比較急,而且有點不痛不癢。
AI 世界瞬息萬變,或許再過一段時間,這場價格風(fēng)波會迭代成新的戰(zhàn)斗方式,幾分幾厘的爭執(zhí)并不重要。不過,在這個也許會轉(zhuǎn)瞬而逝的風(fēng)波面前,我們試圖稍作停頓,找尋國產(chǎn)大模型降價背后的原因,以及這場風(fēng)波有可能的后續(xù)。
01 國產(chǎn)AI大促銷,一家更比一家低
截至目前,參與到 “ 價格戰(zhàn) ” 中的大廠有字節(jié)跳動、阿里、百度、騰訊。
5 月 15 日,字節(jié)跳動正式發(fā)布旗下豆包大模型,在發(fā)布會上重點強(qiáng)調(diào)了豆包的價格優(yōu)勢。那天,豆包在這幾家大廠里還是最便宜的,在國內(nèi)整體大模型廠商中也幾乎是最低價,豆包主力模型在企業(yè)市場的定價只有 0.0008元/千Tokens,比行業(yè)便宜 99.3% 。
一周后,阿里和百度在同天跟進(jìn)降價。通義千問 GPT-4 級主力模型降價 97%,差不多打了一折,API 輸入價格從 0.02 元/千Tokens 降至 0.0005元/千Tokens,比豆包還便宜 0.3 厘。另一邊,百度文心大模型的兩大主力模型 ERNIE Speed 和 ERNIE Lite 干脆直接宣布免費。
次日,騰訊混元大模型也來了一波價格普降,除混元-pro 的輸出價格仍保持在 0.1 元/千Tokens 之外,其他大模型的價格都降了 50%-87.5% 不等。調(diào)價前,最貴的是 0.12 元/千Tokens 的混元-standard-256k 大模型,而這次降價最多的也是它,輸入價格調(diào)至 0.015元/千Ttokens,輸出價格 0.06 元/千Tokens,降幅分別為 87.5% 和 50% 。在騰訊云降價的同一天,科大訊飛旗下大模型訊飛星火 API 能力也正式免費開放。
如今,國產(chǎn)大模型已經(jīng)進(jìn)入了以毫厘論價甚至免費的時代。
客觀來說,大模型降價是一直以來的趨勢。
去年以來,OpenAI 就進(jìn)行了多次降價,5 月 13 日新發(fā)布的 GPT-4o,面向 ChatGPT 的所有付費和免費用戶發(fā)布,取消其他所有限制,API 價格從 0.1 元/千Tokens 降至 0.035 元/千Tokens( 價格單位經(jīng)過換算以便與國產(chǎn)廠商對齊?)。
幾位行業(yè)人士對知危表示,降價這件事不算大,也不算稀奇。“ 現(xiàn)在價格被打下來的主要是文字生成這塊的大模型,行業(yè)其實還沒有做到把別的模態(tài)也打下來。而經(jīng)歷過去一年多的技術(shù)迭代,文字生成效果比較好的模型現(xiàn)階段已經(jīng)可以跑到端側(cè)了,端測運行客觀來講就是免費的。” 心光 App 聯(lián)合開發(fā)者王禹效對知危說。
他補(bǔ)充,降價這件事本身可能也有很多沒直接說的東西。“ 比如 OpenAI 有兩種報價,一種報價對應(yīng)的服務(wù)響應(yīng)比較快,另一種報價響應(yīng)慢一些,也就是他們把服務(wù)器的剩余資源拿來給你用。一般來說,大模型廠商不太可能把最好的模型拿來做免費,你會發(fā)現(xiàn)真正的好東西還是很貴,因為好的模型的算力成本也確實高。”
國產(chǎn)大模型在這個 5 月紛紛拿出價格誠意,一方面是大勢所趨,連技術(shù)水平更高的大模型都沒那么貴,上述企業(yè)自然也希望通過降價獲得更多市場。
另一方面,來自于大模型自身的迭代。王禹效說,從技術(shù)角度來看,最開始大模型需要瘋狂堆料,但后來再做優(yōu)化的時候會發(fā)現(xiàn),其實不用堆太大的參數(shù),可以通過知識蒸餾降低計算資源和模型大小,那之前的模型成本就能降到之前的十分之一,還能保證差不多的效果,降價也就順理成章了。
02 噱頭大于實際的一次價格戰(zhàn)
在豆包大模型發(fā)布會上,火山引擎負(fù)責(zé)人譚待表示,大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本。而且,如今基座大模型已經(jīng)進(jìn)入了穩(wěn)定迭代的階段,在模型訓(xùn)練和推理使用上,都還有長足的優(yōu)化空間,成本下降得很快。
字節(jié)的解釋,透露出兩個信息。一是模型結(jié)構(gòu)完成了優(yōu)化調(diào)整,算力效率提升了,這是降價的底氣。二是通過降價拉高市場使用量,反過來對大模型的繼續(xù)迭代也是好事。
理論上講,這是一個完美的答案。不過,如果再仔細(xì)推敲起這個邏輯,很多現(xiàn)實結(jié)果還有待驗證。
首先,從商業(yè)模式上說根基不穩(wěn)。AI 應(yīng)用創(chuàng)業(yè)者谷林( 化名 )對知危表示,以價換量占領(lǐng)市場,這個邏輯看起來是對的也是常見做法,但這一策略需依賴于能夠?qū)崿F(xiàn)規(guī)模效應(yīng)的商業(yè)模式,大模型 API 卻并不是:
“ 大模型面向 B 端用戶,也就是開發(fā)者,要切換 API 的話,不存在切換門檻和壁壘?!?/p>
大模型的成本分有模型訓(xùn)練、商業(yè)服務(wù)、API 服務(wù)這三類。
單說訓(xùn)練成本,就需要昂貴的投入,包括優(yōu)質(zhì)工程師、標(biāo)注過的高質(zhì)量數(shù)據(jù)以及各領(lǐng)域科學(xué)家對模型進(jìn)行調(diào)優(yōu),這些成本都十分高昂。此外,API 使用模型進(jìn)行推理的運算成本,涉及顯著的電力和硬件消耗。
谷林表示,“ 正常的商業(yè)模式,就算沒有利潤,也要考慮到卡的成本和電力成本的,如果 toB 要持續(xù)提供好的服務(wù),一定是要有利潤的。現(xiàn)在廠商給出每百萬 Tokens 幾塊錢幾毛錢的價格,電價可能都不夠,更別提卡了,那肯定要靠企業(yè)從其他業(yè)務(wù)的利潤上拿來做補(bǔ)貼?!?/p>
就像消費互聯(lián)網(wǎng)常見的 “ 百團(tuán)大戰(zhàn) ” 一樣,在 AI 大模型領(lǐng)域,先挑起價格敏感的,也是大廠。無論算力效率如何提升,成本如何比以前降低,AI 大模型畢竟沒有到一個全行業(yè)形成價格標(biāo)準(zhǔn)的時代,現(xiàn)在去無限壓低價格,還是比較具有煽動性的事情。
不過,如此降價能不能長期持續(xù)也不好定論。
如果是傳統(tǒng)的 “ 價格戰(zhàn) ”,賣的是一次性或標(biāo)準(zhǔn)化的服務(wù),那確實誰便宜誰占領(lǐng)市場。但 AI 大模型不一樣,畢竟 toB 的技術(shù)企業(yè)還是要不斷做研發(fā)創(chuàng)新的,現(xiàn)在的低價買到現(xiàn)在的技術(shù),日后開發(fā)者必然也需要更好更與時俱進(jìn)的技術(shù)支持,到那時還可以用現(xiàn)在的價格去買嗎?
還有一個值得注意的點,大廠尚有充裕的算力資源可以拿出來做低價,“ 反而是現(xiàn)在正在燒錢跑的模型側(cè)的一些公司,包括跑開源的公司,他們壓力比較大,因為模型研發(fā)還是挺貴的,是一個比較重資產(chǎn)的游戲?!?王禹效表示。
在行業(yè)人士看來,國內(nèi)這批大模型理論上是要比 OpenAI 等海外廠商的大模型差上 2-3 代,要補(bǔ)齊差距可能也要半年到一年的時間。
也就是說,現(xiàn)在這撥低價,是用舊的模型去促銷,搶存量市場,壓力還在后頭。
所以,這可能不是一場 “ 價格戰(zhàn) ”,而是賠本賺吆喝。
03 價格不是當(dāng)下最需要卷的
價格降了,無疑會帶來不少正向的影響。
能幫助到現(xiàn)有應(yīng)用的開發(fā)團(tuán)隊,為其提供很多選擇,可以把免費或超低價的模型都拿來試試。同時也能帶來新的創(chuàng)業(yè)機(jī)會,在幾乎不需要考慮這方面成本的情況下,一些好的想法更容易落地。無論如何,大模型通過低價一定會收獲使用量上的暴增。
因為大模型便宜了,所以選擇用用看,這個邏輯是成立的。但是,要不要繼續(xù)用下去,或者長期選擇哪個大模型,卻不是以價格為導(dǎo)向的。
王禹效解釋,在國內(nèi)這批大模型宣布降價之前,一個創(chuàng)業(yè)者如果真想做點什么,那幾乎每家大模型廠商都會給出很高的免費額度?!?比如 GPT 一開始給的是將近 2 萬人民幣的免費額度,大家都可以申請?!?/p>
對于真的有想法想做 AI 創(chuàng)業(yè)的人來說,價格不是最核心的痛點,只能說低價或 0 元購吸引他們過來創(chuàng)業(yè)了,但繼續(xù)做下去的話,不會有人因為這款模型便宜就一直用,還是要篩選技術(shù)更好,更符合自己應(yīng)用開發(fā)需求的模型。
“ 對開發(fā)者而言,免費可以毫無顧忌地使用到更多場景下進(jìn)行推理,使用更長的 Context 提升推理的精確度和內(nèi)容的多樣性。但在認(rèn)真做產(chǎn)品的團(tuán)隊,在技術(shù)選型上,還是首先考慮多模態(tài)的支持和內(nèi)容質(zhì)量,而不僅僅是基于成本考慮。最終一定是回歸到大模型廠商的技術(shù)和服務(wù)上來,這才是壁壘,價格不是壁壘?!?谷林坦言。
不僅是開發(fā),在應(yīng)用運營的實際情況中,價格也不敏感。
王禹效舉例,“ 前兩天我們 App 的技術(shù)同事還問我,要不要搭一套新架構(gòu),這樣隨時可以在后臺切換任何模型,都可以試試,還不會影響到業(yè)務(wù)。我覺得這個事情不著急,因為在應(yīng)用側(cè)的實際情況中,用戶是不在乎你用了什么模型的,用戶只在乎你的場景。所以,對于開發(fā)者來說,今天這個模型好,明天那個模型差,誰便宜了幾毫厘,誰免費了,都沒太大意義,你只要把用戶最關(guān)心的某個場景的問題解決了就好。”
更何況,一款 AI 產(chǎn)品會用到不止一個模型,價格高的模型、價格低的模型、免費的模型,開發(fā)者都可以用,免費的模型可以用在邊角料上,做點簡單的處理。當(dāng)一個開發(fā)者同時是所有價位的模型的客戶,似乎也不存在用價格搶客戶的事情了,只能說大家都有飯吃。
說白了,眼下國產(chǎn)大模型的 “ 價格戰(zhàn) ” 更像是營銷手段,為廠商帶來短期的獲客,而真正決定留客率的還是模型本身的技術(shù)水平。這也是從業(yè)者們對大模型 “ 價格戰(zhàn) ” 并不興奮的原因。不會因為便宜而一直選擇,更不會因為貴就放棄好的模型。
他們只覺得,在 AI 大模型還處于沒有確立標(biāo)準(zhǔn)的野蠻時代,廠商用價格作為營銷策略也是能理解的,就像字節(jié)在著重強(qiáng)調(diào)豆包的價格優(yōu)勢一樣?!?字節(jié)銷售也是總來找我們,和其他廠商比,感覺字節(jié)大模型在營銷上確實算最賣力的。”?王禹效說。
歸根結(jié)底,開發(fā)者和大模型是雙向選擇的過程。篩選客戶的核心不是誰家便宜,這跟消費互聯(lián)網(wǎng)的價格戰(zhàn)不一樣。
谷林解釋,“ ToC 的產(chǎn)品用戶切換的壁壘,有用戶心智,有市場占有。假如說廠商是 toC 之后積累了規(guī)模效應(yīng)后,競爭優(yōu)勢很難打破,但現(xiàn)在大模型廠商提供的就是 API,不存在規(guī)模效應(yīng),B 端用戶的切換成本也不高。實施免費和補(bǔ)貼市場策略是否真的有助于商業(yè)增長,能形成商業(yè)壁壘嗎?這個策略是幫助行業(yè)發(fā)展,還是進(jìn)入劣幣驅(qū)逐良幣的內(nèi)卷?”
搞促銷,是互聯(lián)網(wǎng)博弈局的常見套路。只是,對于正在探索的應(yīng)用層開發(fā)者和躍躍欲試的新創(chuàng)業(yè)者來說,這次不一樣,價格沒那么重要。
王禹效坦言,“ 機(jī)會真是滿天飛,你快點開始做就行了。現(xiàn)在立刻開始做,遠(yuǎn)比你去選哪個模型,哪個廠商,哪個更便宜,來得更實際一些。”
撰文:粥粥,編輯:大餅
本文由人人都是產(chǎn)品經(jīng)理作者【知?!浚⑿殴娞枺骸局!?,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!