DeepSeek,把國產(chǎn)AI的想象力拉滿了
DeepSeek的出現(xiàn)不僅在全球范圍內(nèi)引發(fā)了廣泛關(guān)注,更在AI領(lǐng)域掀起了一場(chǎng)技術(shù)與商業(yè)的雙重革命。本文將深入探討DeepSeek如何通過其低成本、高效率的模型設(shè)計(jì),打破傳統(tǒng)AI巨頭的壟斷,推動(dòng)AI技術(shù)的普及和應(yīng)用。
2025年的新年,人們十足地過了一把“AI年”。除了機(jī)器人和無人機(jī)地表演外,最炸裂的莫過于DeepSeek了。
目前,該模型受到世界范圍內(nèi)的用戶青睞。其中,在Token價(jià)格方面,DeepSeek-R1相對(duì)于OpenAI的o3-mini低約50%。
在日活躍用戶方面,業(yè)界統(tǒng)計(jì),前者已在短時(shí)間之內(nèi)達(dá)到2215萬,距離ChatGPT的5323萬已達(dá)到其41.6%。順理成章地,DeepSeek成為歷史上用戶增長最快的AI產(chǎn)品。
一些受訪者對(duì)DeepSeek的用戶增長十分自信,并表示其可能會(huì)成為世界上用戶量最大的AI產(chǎn)品。
現(xiàn)在,人們?cè)谟盟鼘W(xué)習(xí)外語、診斷姻緣甚至玄學(xué)算命(部分功能受限)。它的回答“更懂”國人,相當(dāng)多的人已經(jīng)形成了DeepSeek依賴。
從對(duì)于AI行業(yè)發(fā)展的結(jié)果來看,DeepSeek所帶來的影響正在釋放。首先,它降低了AI應(yīng)用的算力成本。“很多以前只能用‘H卡’(英偉達(dá)H系列GPU)跑的需求,現(xiàn)在4090就能跑?!币晃粡臉I(yè)者回答。
其次是,對(duì)比其他家流量較小的開源模型,DeepSeek正在展現(xiàn)出十足商業(yè)潛力。
但目前,全民DeepSeek的熱潮下,仍不足以打破英偉達(dá)等AI巨頭的壟斷,而國產(chǎn)卡的未來仍然任重道遠(yuǎn)。
01 DeepSeek是對(duì)AI行業(yè)的利好
西安電子科技大學(xué)電子工程學(xué)院教授、博士生導(dǎo)師吳家驥認(rèn)為,DeepSeek出現(xiàn)后,美國科技頭牌企業(yè)構(gòu)筑的壟斷門檻邏輯出現(xiàn)問題。
過去,OpenAI等公司在研發(fā)上投入巨大,但DeepSeek以極低的訓(xùn)練成本實(shí)現(xiàn)了與行業(yè)領(lǐng)先水平相當(dāng)?shù)哪P托Ч_@表明,高投入并非實(shí)現(xiàn)技術(shù)突破的唯一路徑。
一位前小米高管認(rèn)為,DeepSeek最大的價(jià)值在于算法。
技術(shù)上,DeepSeek在算法和工程方面圍繞MoE(混合專家模型)進(jìn)行了創(chuàng)新,從V2的160個(gè)專家擴(kuò)展到V3的256個(gè)專家,實(shí)現(xiàn)671B參數(shù)量下僅需激活37B參數(shù)的高效運(yùn)算,突破了MoE模型此前訓(xùn)練難度大的限制。
直接影響是,它削弱了美國閉源模型的市場(chǎng)競爭力。
龐大的日活用戶和幾次封禁DeepSeek的失敗,讓AI人才有了逆流之勢(shì)。據(jù)了解,在關(guān)于DeepSeek的制裁令發(fā)布后72小時(shí)內(nèi),DeepSeek硅谷研究院收到327份來自美國頭部科技公司的求職申請(qǐng),包括17名Meta首席工程師。
青云科技市場(chǎng)總監(jiān)王玉圓認(rèn)為,ChatGPT是行業(yè)的第一把火,而DeepSeek是另一個(gè)里程碑。
在她看來,在開源領(lǐng)域,Meta的Llama也沒有達(dá)到如此熱度。最為重要的是,DeepSeek所引導(dǎo)的低成本、高性價(jià)比模型將催生AI發(fā)展的下一輪百花齊放?!斑@無疑是對(duì)做AI應(yīng)用和個(gè)人開發(fā)者的重大利好”,她補(bǔ)充。
一位AI應(yīng)用開發(fā)者對(duì)數(shù)科星球DigitalPlanet稱,他曾嘗試用8G顯存的筆記本電腦跑DeepSeek7B私有部署大模型。雖然只是理論上能跑,具體效果還不甚理想,但他已經(jīng)“非常感動(dòng)”了。
因?yàn)?,一旦未來該款大模型可進(jìn)行進(jìn)一步的向下兼容,那么他將不需為GPU算力公司繳納高昂的算力費(fèi)用。
他向數(shù)科星球DigitalPlanet展示了自己正在開發(fā)的自動(dòng)考試和做題軟件。需要用到實(shí)時(shí)算力以生成考試題,在他看來,這種項(xiàng)目要求算力水平不高,如果算力問題解決,那么會(huì)成為頗受歡迎的AI應(yīng)用。
王玉圓認(rèn)為,AI算力成本的下降會(huì)催生更多AI應(yīng)用的誕生,所有的應(yīng)用都會(huì)用生成式AI的邏輯再做一遍(從春節(jié)期間,人們?cè)诟鞣N領(lǐng)域的嘗試,可見一斑)。
而同時(shí),因?yàn)閲a(chǎn)和私有部署的緣故,以往對(duì)AI較為保守的ToB客戶的熱情也在被調(diào)動(dòng)。一些從業(yè)者的回復(fù)稱,新年開年上班第一天,他所在的公司已在著手推動(dòng)新的AI產(chǎn)品采購計(jì)劃。
所以,可以說,DeepSeek的火爆,是對(duì)AI行業(yè)的利好。
02 DeepSeek刺激了算力行業(yè)發(fā)展
DeepSeek對(duì)算力供應(yīng)商而言,展現(xiàn)了驚人的”鲇魚效應(yīng)“。
一位算力行業(yè)從業(yè)者提到,“以前,要租一個(gè)算力機(jī)柜要5年起租”。
據(jù)數(shù)科星球DigitalPlanet計(jì)算,彼時(shí)便宜的算力機(jī)柜可能每月3000元左右,5年總價(jià)約18萬元;貴的如一些一線城市核心地段、高功率、高配置并帶有優(yōu)質(zhì)服務(wù)和高帶寬的機(jī)柜,每月可能12,000元甚至更高,5年總價(jià)約72萬元及以上。
而現(xiàn)在,用戶已可以選擇按Token計(jì)費(fèi)、按算力計(jì)費(fèi)(選卡,選租賃時(shí)間)兩種模式。所以,大面積的AI開發(fā)者的加入、算力成本的下降加之性能優(yōu)化可能讓閑置算力得到再次利用。
“DeepSeek的火爆有可能改善目前智算中心的經(jīng)營模式”,一位前IDC從業(yè)者透露。在他看來,目前的智算中心雖搭建頗多,但運(yùn)營情況不佳?!拔夜烙?jì),80%的國產(chǎn)算力卡都在閑置,但凡能租賃的算力都是英偉達(dá)卡”。
這種閑置的規(guī)模頗大,他透露,一些智算中心甚至有50%是國產(chǎn)卡(硬性要求)。在過去,國產(chǎn)卡在訓(xùn)練的效果不佳,只能分擔(dān)一些推理需求(大模型共分訓(xùn)練和推理兩個(gè)使用算力的場(chǎng)景)。
不過在算力出現(xiàn)新的使用方式后,國產(chǎn)卡的使用率有可能提升。
吳家驥認(rèn)為,作為大模型廠商而言,不選擇國產(chǎn)卡的理由是“盡量減少折騰”,模型廠商更需要穩(wěn)妥方案、專心研究模型技術(shù)而不是和GPU廠家搞適配。
那么DeepSeek是怎么做出來的?
一些專家指出,它使用了PTX(比CUDA更底層)而不是完全使用CUDA(英偉達(dá)深度學(xué)習(xí)的生態(tài)系統(tǒng))。
PTX允許開發(fā)者對(duì)GPU進(jìn)行更細(xì)粒度的控制,能更精準(zhǔn)地調(diào)度計(jì)算任務(wù),實(shí)現(xiàn)更高效的計(jì)算資源利用。在處理大規(guī)模分布式訓(xùn)練時(shí),可避開CUDA框架的抽象層,減少潛在的效率損失,有數(shù)據(jù)表明PTX優(yōu)化可提升約16%的理論算力。
影響是,在當(dāng)前國產(chǎn)GPU發(fā)展的背景下使用PTX,便于DeepSeek未來適配國產(chǎn)GPU。它只需了解國產(chǎn)硬件驅(qū)動(dòng)提供的基本函數(shù)接口,就可仿照英偉達(dá)GPU硬件的編程接口編寫相關(guān)代碼,為國產(chǎn)GPU的軟件兼容性突破提供參考。
吳家驥認(rèn)為,DeepSeek之所以選用PTX技術(shù),反而是因?yàn)樗麄儧]有足夠多的卡。“如果卡夠多,也不會(huì)考慮的”,他說。
應(yīng)該說,從這個(gè)角度而言,DeepSeek的最大貢獻(xiàn)是,可以讓廠商選擇非英偉達(dá)硬件時(shí)也可以高效運(yùn)行模型。
當(dāng)然,至少目前想要沖擊英偉達(dá)的市場(chǎng),還需不斷完善生態(tài)。在DeepSeek的刺激下,目前一些對(duì)成本敏感或有自主可控需求的用戶,可能會(huì)更傾向于選擇國產(chǎn)GPU產(chǎn)品。
總而言之,可以肯定的是,DeepSeek的出現(xiàn)可以在一定程度上緩解高端GPU禁售的影響。
03 端側(cè)模型:AI硬件的新想象
DeepSeek的遠(yuǎn)期影響是AI硬件。長久以來,端側(cè)模型成為了制約AI硬件發(fā)展的桎梏。而目前,這種情況有望緩解。
現(xiàn)在,手機(jī)的顯存通常在4GB-12GB之間。中高端手機(jī)為例,真正能分配給模型的顯存可能僅在2GB-4GB左右。由于手機(jī)散熱、功耗等方面的限制,長時(shí)間高負(fù)載運(yùn)行大顯存模型會(huì)導(dǎo)致手機(jī)發(fā)熱嚴(yán)重、電量消耗過快,影響用戶體驗(yàn)。
而由于更便宜、更好用的大模型到來后,AI硬件的大面積改良或?qū)⒊蔀榭赡堋?/p>
一位AI硬件創(chuàng)業(yè)者指出,DeepSeek的出現(xiàn)改變了AI硬件在大模型行業(yè)發(fā)展的方向。其中,眾多團(tuán)隊(duì)開始向算法效率優(yōu)化傾斜。
在未來可預(yù)期的范圍內(nèi),針對(duì)AI硬件的算法將出現(xiàn)海量迭代。
此外,由于DeepSeek的推理成本降至OpenAI模型的1/50,使得AI手機(jī)、AI眼鏡、智能穿戴等設(shè)備能夠采用低功耗芯片實(shí)現(xiàn)高性能AI功能。
所以硬件的開發(fā)門檻也被降低了。
正如上文所述,在海量AI應(yīng)用呼之欲出之際,將倒逼AI硬件的進(jìn)化。有樂觀人士稱,端側(cè)智能與國產(chǎn)替代將成為新的核心增長引擎。
作者丨嘟嘟與石榴 編輯丨大兔
本文由人人都是產(chǎn)品經(jīng)理作者【數(shù)科星球公眾號(hào)】,微信公眾號(hào):【數(shù)科星球DigitalPlanet】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!