2025年,“大模型價(jià)格戰(zhàn)”不怕虧錢了?
2025年,大模型領(lǐng)域的競(jìng)爭(zhēng)愈發(fā)激烈,價(jià)格戰(zhàn)再次成為企業(yè)爭(zhēng)奪市場(chǎng)份額的重要手段。本文將深入探討大模型價(jià)格戰(zhàn)的現(xiàn)狀和背后邏輯,分析企業(yè)為何在面臨虧損風(fēng)險(xiǎn)時(shí)仍敢于降價(jià)競(jìng)爭(zhēng)。
過(guò)去一年,大模型作為科技圈頂流,從誕生到落地的發(fā)展過(guò)程都極其迅速,開(kāi)始應(yīng)用后也不出意外地打起了互聯(lián)網(wǎng)最擅長(zhǎng)的價(jià)格戰(zhàn)。據(jù)不完全統(tǒng)計(jì),參與大模型價(jià)格戰(zhàn)的企業(yè)包括字節(jié)跳動(dòng)、阿里、百度、騰訊、科大訊飛……
2024年年末,阿里再度宣布大模型降價(jià),甚至降價(jià)幅度超過(guò)了80%。
坦白來(lái)說(shuō),起初的大模型價(jià)格戰(zhàn)的確在短時(shí)間里為企業(yè)創(chuàng)造了不少流量,百度在去年8月份就曾透露,百度文心大模型5月API日均調(diào)用次數(shù)是2億,8月增長(zhǎng)到了6億次;5月日均Token消耗量是2500億,8月增長(zhǎng)到了1萬(wàn)億。
字節(jié)跳動(dòng)的豆包在7月份的日均Token用量也超過(guò)5000億,相比5月,平均日均Token使用量增長(zhǎng)了22倍。但與所有行業(yè)一樣,價(jià)格戰(zhàn)持續(xù)太久必定回頭反噬企業(yè)的利潤(rùn),數(shù)據(jù)顯示,去年5月份之前,國(guó)內(nèi)大模型推理算力毛利率高于60%,5月各大廠接連降價(jià)后,推理算力毛利率跌至負(fù)數(shù)。
這本是一個(gè)可怕的數(shù)字,但不知為何2025年,大模型的價(jià)格戰(zhàn)又打響一炮。
一、“價(jià)格戰(zhàn)”的底氣又上升了一點(diǎn)
新的一年里,大模型價(jià)格戰(zhàn)的激烈程度有增無(wú)減,除阿里之外,字節(jié)跳動(dòng)、月之暗面也紛紛加入新一輪降價(jià)大潮中。2025年,一度花錢如流水,虧損到生死不明的大模型企業(yè)又打得起價(jià)格戰(zhàn)了嗎?
首先,可以肯定大模型企業(yè)在現(xiàn)實(shí)落地、融資盈利等方面迎來(lái)一些可觀的轉(zhuǎn)折。從去年下半年開(kāi)始,國(guó)內(nèi)大模型落地版圖基本有了模糊的輪廓,信息處理、客服銷售、硬件終端、AI工具、學(xué)習(xí)教育……共同拼出大模型一個(gè)光明的未來(lái)。
2024年1至11月,大模型相關(guān)中標(biāo)項(xiàng)目的盤點(diǎn)結(jié)果顯示,國(guó)內(nèi)大模型中標(biāo)項(xiàng)目共728個(gè),中標(biāo)總金額為17.1億元,分別是2023年全年數(shù)據(jù)的3.6倍、2.6倍。受此影響,大模型企業(yè)在這方面也開(kāi)始產(chǎn)生收入。
百度數(shù)據(jù)顯示,去年第三季度,百度智能云營(yíng)收達(dá)49億元,同比增長(zhǎng)11%,AI相關(guān)收入占比持續(xù)提升至超11%。無(wú)獨(dú)有偶,阿里云季度營(yíng)收增長(zhǎng)至265.49億元人民幣,同比增長(zhǎng)6%。其中,AI相關(guān)產(chǎn)品收入實(shí)現(xiàn)三位數(shù)增長(zhǎng)。
其次,大模型領(lǐng)域在經(jīng)歷兩年的融資下滑期后,終于在2024年有所回溫。數(shù)據(jù)顯示,2024年前九個(gè)月,AI領(lǐng)域共完成融資金額371.5億元,相比2023年同期翻了1倍多??傊?,在應(yīng)用落地后實(shí)現(xiàn)小規(guī)模業(yè)績(jī)營(yíng)收、資本重新眷顧后,有錢是大模型賽道繼續(xù)價(jià)格戰(zhàn)的底氣。
但當(dāng)前大模型企業(yè)的盈利能力真的可以撐起一場(chǎng)場(chǎng)無(wú)序而混亂的價(jià)格戰(zhàn)嗎?
時(shí)至今日,大模型的運(yùn)營(yíng)成本、后續(xù)虧損仍舊居高不下。海外頭部大模型企業(yè)如OpenAI,2024年的運(yùn)營(yíng)成本將超過(guò)85億美元,預(yù)計(jì)虧損約50億美元,預(yù)計(jì)2023年至2028年的總虧損將達(dá)到440億美元。
至于模型訓(xùn)練成本,OpenAI預(yù)測(cè)到2026年會(huì)高達(dá)95億美元。
國(guó)內(nèi)在大模型行業(yè)雖小有成就,但與全球大模型平均發(fā)展速度相比,停止或者減少訓(xùn)練研發(fā)還為時(shí)尚早。斯坦福大學(xué)基礎(chǔ)模型研究中心在去年9月份發(fā)布了一則排名,排名前十的模型廠商包括AI創(chuàng)業(yè)公司Anthropic旗下的Claude 3.5系列、Meta旗下的Llama3.1系列、OpenAI旗下的GPT-4系列、谷歌旗下的Gemini 1.5系列。
中國(guó)大模型目前僅有阿里旗下的通義千問(wèn)2 Instruct 進(jìn)入了前十,目前全球AI大模型數(shù)量超過(guò)1328個(gè)。往后國(guó)內(nèi)大模型賽道的投入資本只會(huì)越來(lái)越多,2024年,盡管整個(gè)人工智能行業(yè)的整體融資額同比翻了1倍多,但融資交易數(shù)只增長(zhǎng)了約10%。
換句話說(shuō),大模型賽道已經(jīng)到了殘酷的淘汰期,截至2024年11月,我國(guó)共有309個(gè)生成式人工智能產(chǎn)品完成備案。頭部吃肉喝湯,小企業(yè)不僅拿不到投資,甚至連繼續(xù)生存都是問(wèn)題。為了活下去,要么價(jià)格戰(zhàn),要么卷營(yíng)銷。
但一心想要提前占領(lǐng)市場(chǎng)的頭部企業(yè)不惜一邊持續(xù)價(jià)格戰(zhàn),一邊瘋狂撒錢營(yíng)銷。
數(shù)據(jù)顯示,豆包在去年6月上旬,新一輪大規(guī)模廣告投放的金額飆升到1.24億元。Kimi在10月份的前20天內(nèi),廣告投放費(fèi)用高達(dá)1.1億元人民幣。2025年,逐漸走向成熟的大模型固然多了一絲底氣,但前路漫漫,需要花錢的地方數(shù)不勝數(shù)。
二、“算力”才是第一生產(chǎn)力
2024年,大模型企業(yè)用接連不斷的價(jià)格戰(zhàn)與鋪天蓋地的廣告,讓各類大模型產(chǎn)品在現(xiàn)實(shí)世界里一再普及,但隨著用戶越來(lái)越多,因算力資源而導(dǎo)致服務(wù)崩盤的事故再次讓整個(gè)大模型賽道陷入沉思。
不完全統(tǒng)計(jì)顯示,去年一年,Kimi、文心一言、ChatGPT……皆曾出現(xiàn)過(guò)無(wú)法正常使用的情況。ChatGPT還有一度因?yàn)樾枨罅窟^(guò)大暫停新用戶注冊(cè)。國(guó)內(nèi)則一到論文季,Kimi等主打文本處理類的產(chǎn)品就“癱瘓”。
算力之于大模型的發(fā)展有多重要?算力、算法、數(shù)據(jù)一度被認(rèn)為是大模型技術(shù)的“三馬車”。這兩年,算法的創(chuàng)新使算力需求一直處于高增長(zhǎng)狀態(tài),對(duì)比GPT-3與最新發(fā)布的LLaMA3-405B,雖然前后模型規(guī)模僅增大2.3倍,但所需算力卻增長(zhǎng)了116倍。
因此,算力逐漸成為大模型賽道的第一生產(chǎn)力,而全球頭部大模型企業(yè)在算力上的布局早已拉開(kāi)序幕。
據(jù)悉,OpenAI與微軟的巨型數(shù)據(jù)中心項(xiàng)目,預(yù)計(jì)成本超過(guò)1150 億美元,配備數(shù)百萬(wàn)塊 GPU。但OpenAI仿佛并不滿足,又與甲骨文達(dá)成合作,在德州建立的數(shù)據(jù)中心未來(lái)可容納數(shù)十萬(wàn)個(gè)英偉達(dá)GPU;Meta計(jì)劃儲(chǔ)備35萬(wàn)張英偉達(dá)H100GPU,未來(lái)算力儲(chǔ)備將達(dá)到60萬(wàn)張。
國(guó)內(nèi)的算力需求也進(jìn)一步爆發(fā)。一方面,用戶體驗(yàn)需要算力資源支撐,另外一方面,各大企業(yè)之間的產(chǎn)品趨于同質(zhì)化,在技術(shù)上始終沒(méi)有拉開(kāi)一定的差異距離,只能一再卷價(jià)格。算力或許會(huì)是未來(lái)破局的關(guān)鍵。
有機(jī)構(gòu)預(yù)測(cè)過(guò),到2030年國(guó)內(nèi)100%的推理需求都需要由超大規(guī)模數(shù)據(jù)中心來(lái)完成。全球大模型賽道掀起一陣智算中心熱,截至2024年上半年,國(guó)內(nèi)也已經(jīng)建設(shè)和正在建設(shè)的智算中心超過(guò)250個(gè),2024年上半年智算中心招投標(biāo)相關(guān)事件791起,同比增長(zhǎng)高達(dá)407.1%。
但國(guó)內(nèi)當(dāng)前的算力供應(yīng)有一個(gè)不可忽視的點(diǎn):芯片。
數(shù)據(jù)顯示,國(guó)內(nèi)AI訓(xùn)練芯片市場(chǎng)英偉達(dá)占據(jù)了80%的市場(chǎng)份額,在算力供應(yīng)鏈形成之前,這無(wú)疑是必須改變的一個(gè)僵局。上海的“算力浦江”智算行動(dòng)實(shí)施方案里就表示,要在2025年,實(shí)現(xiàn)新建智算中心的國(guó)產(chǎn)算力芯片使用占比超過(guò)50%。
除了芯片,全球大模型賽道推崇的10萬(wàn)卡群實(shí)際建設(shè)起來(lái)要面臨的現(xiàn)實(shí)問(wèn)題還有很多。
一來(lái),數(shù)據(jù)中心耗電巨大,有數(shù)據(jù)指出,10萬(wàn)卡集群的日耗電量可達(dá)300萬(wàn)度,相當(dāng)于一個(gè)城市的日均居民用電量。二來(lái),算力集群越大,故障率也呈上升趨勢(shì),10萬(wàn)卡集群每20分鐘可能會(huì)出現(xiàn)故障;三來(lái),當(dāng)前算力短缺且昂貴,但不少企業(yè)訓(xùn)練大模型的算力有效利用率往往不足 50%。
當(dāng)然,整個(gè)大模型賽道上至企業(yè)、下至相關(guān)部門都在想方設(shè)法解決算力供應(yīng)過(guò)程中的各種意外。首先,在能源損耗方面,海外很多國(guó)際公司已選擇分布式部署的策略,谷歌和微軟也在推進(jìn)多數(shù)據(jù)中心的協(xié)同訓(xùn)練。
至于芯片方面,國(guó)內(nèi)不少企業(yè)在進(jìn)行多芯混訓(xùn),如百度在異構(gòu)算力的統(tǒng)一管理下,已經(jīng)實(shí)現(xiàn)95%的混合訓(xùn)練效能,并將集群故障恢復(fù)時(shí)間縮短至分鐘級(jí)。從國(guó)內(nèi)一部分算力集群的利用率上看,算力浪費(fèi)的情況正在改善,西安一人工智算中心算力使用率高達(dá)98.5%。
種種跡象表明,全球大模型市場(chǎng)“開(kāi)弓沒(méi)有回頭箭”,所幸這一次,科技圈應(yīng)該不會(huì)再重現(xiàn)元宇宙的悲劇了。
三、2025年,是時(shí)候“卷應(yīng)用”了?
開(kāi)始創(chuàng)造實(shí)際價(jià)值,成了2025年大模型賽道的主基調(diào)。目前,大模型應(yīng)用已經(jīng)逐漸滲透到金融、醫(yī)療健康、教育培訓(xùn)、搜索、辦公等多個(gè)場(chǎng)景。李彥宏曾經(jīng)直言,行業(yè)不應(yīng)該再卷模型了,應(yīng)該直接創(chuàng)造應(yīng)用價(jià)值。
根據(jù)“經(jīng)濟(jì)觀察報(bào)”統(tǒng)計(jì),截至2024年10月9日,網(wǎng)信辦共通過(guò)188項(xiàng)生成式人工智能備案,但超過(guò)三成的大模型在通過(guò)備案后未進(jìn)一步公開(kāi)其進(jìn)展情況;僅有約一成的大模型仍在加速訓(xùn)練模型;接近一半的大模型則直接轉(zhuǎn)向了AI應(yīng)用的開(kāi)發(fā)。
形成這種局面的原因也不難猜。一方面,行業(yè)的價(jià)格戰(zhàn)無(wú)論還繼不繼續(xù),其背后所能發(fā)揮的效應(yīng)也大不如前,在各大巨頭的相互壓迫下,整個(gè)市場(chǎng)不得不趨于良性競(jìng)爭(zhēng)。另外一方面,算力資源等技術(shù)發(fā)展現(xiàn)狀讓基礎(chǔ)模型動(dòng)輒一次就要數(shù)億美元的投入。
馬斯克曾估算,GPT-5的訓(xùn)練可能需要3萬(wàn)-5萬(wàn)張英偉達(dá)H100芯片,僅芯片成本就超過(guò)7億美元。轉(zhuǎn)向應(yīng)用,自然就成了一大部分企業(yè)拼不過(guò)技術(shù)、資本后,選擇曲線救國(guó)的一種主要方式。
而頭部企業(yè)雖然在技術(shù)資源、資金方面勉強(qiáng)還算充裕,但市場(chǎng)搶奪早在大模型爆發(fā)之際就啟動(dòng)了“加速鍵”,如果不以應(yīng)用提前占據(jù)先機(jī),很有可能會(huì)被淹沒(méi)在歷史的塵埃里。僅在國(guó)內(nèi),通用大模型、行業(yè)大模型在這兩年層出不窮。
《生成式人工智能服務(wù)管理暫行辦法》顯示,通過(guò)備案的通用大模型包括百度文心一言、商湯大模型“商量SenseChat”、百川智能的百川大模型、智譜華章的“智譜清言”;行業(yè)大模型包括昆侖萬(wàn)維“天工”大模型、知乎“知海圖AI”模型、金山辦公“WPS AI”、好未來(lái)“MathGPT”大模型、網(wǎng)易有道“子曰”教育大模型。
一些企業(yè)的“模海戰(zhàn)術(shù)”已開(kāi)啟,典型的例子是阿里,2024年云棲大會(huì),阿里不僅宣布再度降價(jià),還一口氣上架了100 多個(gè)模型,包括大語(yǔ)言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型。大模型一涌而出,于整個(gè)賽道而言,或許是百家爭(zhēng)鳴的好事。
但于某一家企業(yè)而言,同類產(chǎn)品一個(gè)接一個(gè)面世,自身產(chǎn)品的獨(dú)特性就會(huì)大打折扣,尤其當(dāng)前大模型賽道本就陷入同質(zhì)化泥沼無(wú)法自拔。以百度為例,去年百度的大模型收入雖然有所上升,但增速卻大幅度下降。
數(shù)據(jù)顯示,2024年第三季度,百度云的環(huán)比增速?gòu)?4%降至11%,生成式AI云收入環(huán)比增速?gòu)?5%驟降至17%。究其原因,與市場(chǎng)競(jìng)爭(zhēng)加劇脫不開(kāi)關(guān)系,為了守住市場(chǎng)份額,“應(yīng)用”價(jià)值必須提升。
然而,企業(yè)一味奔向應(yīng)用,放棄技術(shù)進(jìn)步可以嗎?有一點(diǎn)不得不提,目前大模型市場(chǎng)拿單效率與模型本身息息相關(guān)。去年一年里,大模型招標(biāo)項(xiàng)目陡增,其中,阿里云、百度云、騰訊云、字節(jié)的火山云皆是中標(biāo)常客。
但細(xì)究下來(lái),騰訊云共計(jì)中標(biāo)28個(gè),金額總計(jì)2.1億元;阿里云中標(biāo)20個(gè),共計(jì)中標(biāo)5.7億元;百度云中標(biāo)37個(gè),共計(jì)拿下5億元的單子;火山云中標(biāo)24個(gè),但總金額只有6186萬(wàn)元。
四家為什么會(huì)差異至此?這其中是由于火山云雖拿遍智能體細(xì)分領(lǐng)域的訂單,但智能體的復(fù)雜性和客制化難度并不算高,所以客單價(jià)會(huì)受研發(fā)量規(guī)模上下浮動(dòng)。換句話說(shuō),大模型的“錢景”始終與技術(shù)正相關(guān),2025年,大模型只能接著卷下去。
文丨江心白 出品丨消費(fèi)最前線?
本文由人人都是產(chǎn)品經(jīng)理作者【消費(fèi)最前線】,微信公眾號(hào):【消費(fèi)最前線】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
大模型價(jià)格戰(zhàn)真是個(gè)大新聞呀!雖然現(xiàn)在看起來(lái)競(jìng)爭(zhēng)激烈,但長(zhǎng)遠(yuǎn)看,這可能會(huì)加速AI應(yīng)用的普及。對(duì)于大廠來(lái)說(shuō),他們有資金和技術(shù)優(yōu)勢(shì),降價(jià)可以吸引更多用戶,擴(kuò)大市場(chǎng)份額。不過(guò),這也給創(chuàng)業(yè)公司帶來(lái)了壓力,他們得在降低成本的同時(shí),尋找差異化競(jìng)爭(zhēng)??傊?,價(jià)格戰(zhàn)會(huì)讓市場(chǎng)重新洗牌,最終留下真正有實(shí)力的企業(yè)。