DeepSeek爆火背后:2025年AI大模型的潮水會(huì)流向哪?
從當(dāng)下來看,DeepSeek的出現(xiàn)打破了固有的算力、模型中的部分環(huán)節(jié)掣肘,但仍有很多問題尚待解決,比如模型的定向蒸餾,比如數(shù)據(jù)體系的構(gòu)建,再比如生態(tài)體系中各方利益的交叉配合等等,這早已經(jīng)不僅是一道技術(shù)命題,而更是一個(gè)行業(yè)向上的產(chǎn)業(yè)命題。?
不過,能肯定的是,2025 年中國(guó) AI 大模型的產(chǎn)業(yè)潮水必然洶涌澎湃,勢(shì)不可擋。
DeepSeek 的出現(xiàn),仿佛逐漸為 AI 的落地應(yīng)用勾勒出了一個(gè)確定性的未來藍(lán)圖。
在過去的幾年間,AI 大模型的入場(chǎng)門檻早已被清晰標(biāo)定 —— 上萬億的參數(shù)規(guī)模、超強(qiáng)的算力支撐以及海量且優(yōu)質(zhì)的的數(shù)據(jù)資源,這些都意味著高昂的 “入場(chǎng)價(jià)格”。
2025 年春節(jié)期間,DeepSeek 如一匹黑馬,強(qiáng)勢(shì)打破了中外 AI 大模型競(jìng)技場(chǎng)原有的規(guī)則。
這家原出身量化機(jī)構(gòu)的團(tuán)隊(duì)將大模型的參數(shù)大幅削減至原來的 1/10,借助強(qiáng)化學(xué)習(xí)與模型蒸餾技術(shù),使得一個(gè)小模型在數(shù)學(xué)題解答方面力壓 GPT – 4o。不僅如此,DeepSeek 還開源代碼、開放 API,以超低的價(jià)格展現(xiàn)出肩比 OpenAI 的強(qiáng)大能力,這讓國(guó)內(nèi)外網(wǎng)友紛紛驚嘆于這 “神秘的東方力量”。
從某種層面來說,這些在水面之上的表現(xiàn)固然令A(yù)I行業(yè)為之震撼,但幾個(gè)更應(yīng)該被延長(zhǎng)時(shí)間線思考的問題恰還是盤繞在2024年AI行業(yè)上空的幾個(gè)核心命題:即產(chǎn)業(yè)大模型距離我們有多遠(yuǎn)?在數(shù)據(jù)、算力、模型的三層節(jié)點(diǎn)上,在去年幾乎達(dá)成共識(shí)的AI應(yīng)用上,DeepSeek 這個(gè)“現(xiàn)象級(jí)事件”到底會(huì)帶來什么影響?
2025年,產(chǎn)業(yè)數(shù)智化的大幕已然悄悄拉開。
一、技術(shù)范式變了,模型邁進(jìn)“價(jià)低物優(yōu)”時(shí)刻
在傳統(tǒng) AI 大模型的落地過程中,存在著諸多限制其廣泛應(yīng)用的難題。其中,“看不到希望的燒錢”,位列第一。
以 GPT – 4 為例,其訓(xùn)練數(shù)據(jù)量高達(dá) 13 萬億 token,涵蓋了互聯(lián)網(wǎng)全領(lǐng)域的文本。如此海量的數(shù)據(jù)標(biāo)注工作不僅成本高昂,而且耗時(shí)費(fèi)力。同時(shí),其對(duì)算力的需求也極為龐大,依賴數(shù)萬張 A100 GPU 集群,單次訓(xùn)練成本超過 1 億美元。這種高昂的成本和資源需求,使其技術(shù)很難落地。
DeepSeek的倍受推崇之處也恰在此,即其可以通過純強(qiáng)化學(xué)習(xí)(RL)實(shí)現(xiàn) “自我進(jìn)化”,使其在數(shù)據(jù)準(zhǔn)備方面具有顯著優(yōu)勢(shì)。
換言之,它無需標(biāo)注數(shù)據(jù),這大大降低了數(shù)據(jù)準(zhǔn)備的成本和難度,為開發(fā)者節(jié)省了大量的時(shí)間和精力,讓他們能夠更加專注于模型的訓(xùn)練和優(yōu)化。
同時(shí),DeepSeek 的獎(jiǎng)勵(lì)設(shè)計(jì)極簡(jiǎn),僅用 “答案正確性” 和 “格式規(guī)范” 作為獎(jiǎng)勵(lì)信號(hào)。這種簡(jiǎn)潔的獎(jiǎng)勵(lì)機(jī)制避免了復(fù)雜獎(jiǎng)勵(lì)模型可能導(dǎo)致的 “作弊” 風(fēng)險(xiǎn),使得模型訓(xùn)練更加高效、穩(wěn)定。
這種極簡(jiǎn)獎(jiǎng)勵(lì)設(shè)計(jì),還能夠更好地引導(dǎo)模型朝著正確的方向發(fā)展,提高模型的訓(xùn)練效果。避免一些意想不到的情況,導(dǎo)致模型訓(xùn)練出現(xiàn)偏差。
此外,DeepSeek 采用 GRPO 算法,用組評(píng)分替代傳統(tǒng) Critic 模型,算力消耗降低 30% 以上,進(jìn)一步降低了對(duì)硬件資源的需求,也就是俗稱的對(duì)“卡”的依賴。
值得注意的是,其模型能力也并未因算力的降低,而大打折扣。
在DeepSeek發(fā)表的論文中,一組數(shù)據(jù)顯示DeepSeek-R1 在 AIME 2024 測(cè)試中取得了 79.8% 的 Pass@1 得分,略?于 OpenAI-o1-1217。在 MATH-500 上,其得分達(dá)到了 97.3%,表現(xiàn)與 OpenAI-o1-1217 相當(dāng),并顯著優(yōu)于其他模型。
在DeepSeek身上,外界似乎在發(fā)現(xiàn),算力、參數(shù)似乎不再是AI的入場(chǎng)門檻,或者更準(zhǔn)確來說,是在DeepSeek身上,外界看到了一種更為適配AI落地的低門檻、低成本方式,從成本側(cè)更利好落地。
而從產(chǎn)業(yè)側(cè)來看,這種變化的最佳受益者是中大型廠商。過去兩年時(shí)間里,不論是大型央國(guó)企,還是高校,抑或是民生部門等等,都基于大模型的項(xiàng)目面向市場(chǎng)公開招標(biāo),其中涉及到的很大一部分恰是預(yù)訓(xùn)練項(xiàng)目,這些項(xiàng)目的單價(jià)往往超過千萬乃至上億,作為企業(yè)的定向投入。
但在DeepSeek之后,能夠預(yù)測(cè)的是,今年的中大型大模型項(xiàng)目的標(biāo)的將會(huì)發(fā)生顯著變化,對(duì)于中大企業(yè)乃至央國(guó)企而言,其可以以更低的成本進(jìn)行大模型項(xiàng)目的部署,或者把重點(diǎn)更多的轉(zhuǎn)移到數(shù)據(jù)治理環(huán)節(jié),進(jìn)一步提高最終的模型效果。
同樣受益的還有小型的科技公司,以往其可能因?yàn)橘Y金和技術(shù)限制,無法涉足 AI 領(lǐng)域。但 DeepSeek 的出現(xiàn)為他們提供了可能,企業(yè)可以利用相對(duì)較低的成本,基于 DeepSeek 開發(fā)出適合自己業(yè)務(wù)需求的 AI 應(yīng)用,推動(dòng)公司業(yè)務(wù)的發(fā)展和創(chuàng)新。
總體來看,隨著強(qiáng)化學(xué)習(xí)(RL)技術(shù)范式的變革,不僅 AI 大模型的落地門檻、落地成本將會(huì)降低,還為更多的企業(yè)和開發(fā)者提供了參與 AI 創(chuàng)新的機(jī)會(huì)。這不僅有助于推動(dòng) AI 技術(shù)的發(fā)展,也為各行業(yè)的數(shù)智化轉(zhuǎn)型和升級(jí)提供了新的動(dòng)力。
二、開源加速:垂直小模型的時(shí)代來了
在DeepSeek公布的論文中,除了RL技術(shù)范式的變革,還有另外一個(gè)亮點(diǎn),就是跨維度知識(shí)蒸餾體系的構(gòu)建。
一組數(shù)據(jù)顯示,DeepSeek-R1-Distill-Qwen-7B在AIME 2024評(píng)測(cè)中以55.5%的得分超越原版QwQ-32B-Preview,參數(shù)規(guī)??s減81%的情況下性能提升23%。其32B版本更在MATH-500測(cè)試中達(dá)到94.3%的驚人準(zhǔn)確率,較傳統(tǒng)訓(xùn)練方法提升近40個(gè)百分點(diǎn)。
其通過將32B大模型的推理邏輯解構(gòu)為可遷移的認(rèn)知模式,再經(jīng)由動(dòng)態(tài)權(quán)重分配機(jī)制注入到7B小模型中,實(shí)現(xiàn)了”思維范式”而非單純”知識(shí)記憶”的傳遞。
這種技術(shù)路徑下,小模型不僅繼承了大模型的解題能力,更習(xí)得了問題拆解、邏輯推演的元能力。這也意味著?型模型的推理模式可以蒸餾到?型模型中,其性能優(yōu)于直接在?模型上強(qiáng)化訓(xùn)練的結(jié)果。
在人工智能領(lǐng)域,”模型越大,性能越強(qiáng)”的認(rèn)知長(zhǎng)期占據(jù)主導(dǎo)地位。從GPT-3到GPT-4的進(jìn)化軌跡,似乎都在印證”參數(shù)規(guī)模決定模型能力”的定律。
而隨著這種”蒸餾+強(qiáng)化學(xué)習(xí)”的復(fù)合訓(xùn)練方式的出現(xiàn),小模型的時(shí)代似乎終于要來了。
要知道,對(duì)于許多企業(yè),尤其是中小型企業(yè)和垂直領(lǐng)域?qū)I(yè)企業(yè),在追求模型性能時(shí),往往受限于大型模型所需的巨額計(jì)算資源成本。
DeepSeek 證明?模型也能發(fā)揮?作用后,這些企業(yè)可以減少在硬件設(shè)備(如?性能服務(wù)器、GPU 等)采購(gòu)和租賃上的?出,以及降低能源消耗成本。
例如,?家專注于醫(yī)療影像分析的?型企業(yè),原本若要使??型模型來處理影像數(shù)據(jù),可能需要搭建昂貴的計(jì)算集群,現(xiàn)在借助優(yōu)化后的?模型,可以在普通的計(jì)算設(shè)備上完成任務(wù),?幅降低成本。
在這其中,在?模型有效性的趨勢(shì)下,擁有?業(yè)認(rèn)知的企業(yè)通常對(duì)?身業(yè)務(wù)流程和數(shù)據(jù)特點(diǎn)有深刻理解,他們往往能夠更快速地將模型集成到現(xiàn)有業(yè)務(wù)系統(tǒng)中。
因?yàn)?模型?般具有更簡(jiǎn)單的架構(gòu)和更少的參數(shù),開發(fā)?員可以更便捷地進(jìn)?定制化開發(fā),以適應(yīng)特定?業(yè)的需求。?如,?家?融風(fēng)控企業(yè),基于??對(duì)?融?業(yè)?險(xiǎn)評(píng)估的know – how,能夠迅速將適配的?模型嵌?到其風(fēng)控系統(tǒng)中,縮短開發(fā)周期,更快地實(shí)現(xiàn)模型上線和業(yè)務(wù)優(yōu)化。
在競(jìng)爭(zhēng)激烈的市場(chǎng)中,這種優(yōu)勢(shì),恰恰能使得某些企業(yè)在AI領(lǐng)域?qū)崿F(xiàn)快速超車,成為垂直賽道AI規(guī)則的制定者和引領(lǐng)者。
三、效率與場(chǎng)景突破,端側(cè)應(yīng)用爆發(fā)期來了
眾所周知,在實(shí)際應(yīng)用中,尤其是在邊緣計(jì)算和實(shí)時(shí)決策等場(chǎng)景中,傳統(tǒng) AI 模型往往也面臨著諸多限制。
在邊緣計(jì)算場(chǎng)景中,由于設(shè)備資源有限,如手機(jī)端、眼鏡端等,很難運(yùn)行大型的 AI 模型,從而限制了 AI 技術(shù)在這些領(lǐng)域的應(yīng)用。
此外,在實(shí)時(shí)決策場(chǎng)景中,如金融交易和工業(yè)生產(chǎn),傳統(tǒng) AI 模型的推理速度和準(zhǔn)確性往往難以滿足需求。
DeepSeek 的出現(xiàn)給了一個(gè)新的思路。其在模型壓縮、推理效率以及訓(xùn)練成本優(yōu)化方面的突破,為其在多個(gè)場(chǎng)景的落地應(yīng)用提供了有力支持,帶來了效率和場(chǎng)景上的巨大突破。
DeepSeek 通過模型壓縮技術(shù),使其優(yōu)化后的模型可以更好地適應(yīng)資源有限的設(shè)備,如智能眼鏡等邊緣計(jì)算設(shè)備。這使得邊緣計(jì)算設(shè)備能夠具備更強(qiáng)的 AI 能力,為用戶提供更加便捷、智能的體驗(yàn)。
例如,在智能眼鏡中,DeepSeek 可以實(shí)現(xiàn)更快速、更準(zhǔn)確的圖像識(shí)別和語音交互功能,用戶可以通過智能眼鏡更高效地獲取信息、進(jìn)行導(dǎo)航、識(shí)別物體等,大大提升了智能眼鏡的實(shí)用性和應(yīng)用場(chǎng)景。
在實(shí)時(shí)決策場(chǎng)景方面,其的高效推理能力也發(fā)揮了重要作用。
以金融交易為例,金融機(jī)構(gòu)需要在極短的時(shí)間內(nèi)對(duì)大量的市場(chǎng)數(shù)據(jù)進(jìn)行分析和處理,以做出準(zhǔn)確的投資決策。其能夠快速地對(duì)數(shù)據(jù)進(jìn)行分析和預(yù)測(cè),為金融交易提供實(shí)時(shí)的決策支持,幫助金融機(jī)構(gòu)提高交易效率和盈利能力。
在工業(yè)生產(chǎn)中,實(shí)時(shí)的質(zhì)量檢測(cè)和故障診斷也是至關(guān)重要的。還可以快速地對(duì)生產(chǎn)過程中的數(shù)據(jù)進(jìn)行分析,及時(shí)發(fā)現(xiàn)質(zhì)量問題和設(shè)備故障,從而提高生產(chǎn)效率和產(chǎn)品質(zhì)量,降低生產(chǎn)成本。
可以說,在 2025 年,DeepSeek的出現(xiàn), 或?qū)⒁鹦乱惠喌慕K端應(yīng)用爆發(fā),為各行業(yè)的數(shù)字化轉(zhuǎn)型和升級(jí)提供有力的技術(shù)支撐。DeepSeek 在多個(gè)場(chǎng)景中的應(yīng)用突破,不僅展示了其技術(shù)優(yōu)勢(shì),也為各行業(yè)的數(shù)字化轉(zhuǎn)型和升級(jí)提供了新的解決方案。
四、生態(tài)變革:大廠煉模型、中小廠做應(yīng)用
DeepSeek帶來的還有AI生態(tài)上的變革,而這種變革也將為AI落地產(chǎn)業(yè)的帶來更多可能性。
一個(gè)事實(shí)是,當(dāng)前 AI 產(chǎn)業(yè)呈現(xiàn)出一種 “金字塔結(jié)構(gòu)”,OpenAI、Google 等巨頭把控基礎(chǔ)模型,中層企業(yè)依賴 API 調(diào)用,陷入 “數(shù)據(jù)空心化”,底層中小開發(fā)者缺乏定制能力,淪為生態(tài)附庸。
這種結(jié)構(gòu)的致命缺陷是創(chuàng)新停滯,巨頭為維持壟斷,必然限制模型開放度。
DeepSeek 開源核心模型和開放 API 定制能力,這一舉措打破了以往 OpenAI 等巨頭主導(dǎo)的 “金字塔式” 生態(tài)。
在新的生態(tài)模式下,大廠可以專注于煉模型,利用其強(qiáng)大的技術(shù)實(shí)力和資源優(yōu)勢(shì),不斷優(yōu)化和提升模型的性能和能力。
例如,阿里云、騰訊云等平臺(tái)可以成為 “模型超市”,提供數(shù)百個(gè)垂直領(lǐng)域的小模型,滿足不同行業(yè)和用戶的需求。這些大廠可以通過不斷研發(fā)和創(chuàng)新,推出更加先進(jìn)的模型架構(gòu)和算法,推動(dòng) AI 技術(shù)的發(fā)展和進(jìn)步。
而中小廠則可以專注于做應(yīng)用,基于開源模型快速開發(fā)專用 AI 工具,無需依賴巨頭提供 “黑箱” 能力。這為中小廠提供了更多的發(fā)展空間和機(jī)會(huì),使它們能夠充分發(fā)揮自身的靈活性和創(chuàng)新能力,開發(fā)出更加貼近用戶需求和行業(yè)特點(diǎn)的 AI 應(yīng)用。
例如,一些中小廠可以針對(duì)工業(yè)質(zhì)檢、供應(yīng)鏈預(yù)測(cè)等確定性需求,通過 API 按需微調(diào)模型,開發(fā)出高效、精準(zhǔn)的 AI 應(yīng)用,為用戶提供定制化的解決方案。這種生態(tài)變革還帶來了技術(shù)民主化、生態(tài)正循環(huán)和場(chǎng)景定制化等多方面的好處。
技術(shù)民主化可以使制造業(yè)、農(nóng)業(yè)等非科技企業(yè)也能夠參與到 AI 技術(shù)的應(yīng)用和創(chuàng)新中,促進(jìn)各行業(yè)的數(shù)字化轉(zhuǎn)型和升級(jí)。生態(tài)正循環(huán)則可以通過開發(fā)者貢獻(xiàn)行業(yè)數(shù)據(jù)優(yōu)化模型,并從模型收益中分成,形成了 “數(shù)據(jù) – 模型 – 應(yīng)用” 的協(xié)同網(wǎng)絡(luò),推動(dòng) AI 產(chǎn)業(yè)的可持續(xù)發(fā)展。
可以說,DeepSeek 帶來的生態(tài)變革,不僅為 AI 產(chǎn)業(yè)的發(fā)展帶來了新的機(jī)遇,也為各行業(yè)的數(shù)字化轉(zhuǎn)型和升級(jí)提供了新的動(dòng)力。未來,隨著 DeepSeek 技術(shù)的不斷發(fā)展和完善,其在生態(tài)變革方面的潛力將進(jìn)一步釋放,為 AI 產(chǎn)業(yè)的發(fā)展帶來更多的可能性。
五、2025,AI 的新走向
2025年,AI落地產(chǎn)業(yè)的走向越發(fā)清晰。
在 2025 年,AI 的發(fā)展將從過去對(duì)技術(shù)的單純崇拜,逐步轉(zhuǎn)向更加注重商業(yè)務(wù)實(shí)的落地應(yīng)用。這一轉(zhuǎn)變體現(xiàn)在技術(shù)研發(fā)、商業(yè)化路徑以及生態(tài)聯(lián)盟構(gòu)建等多個(gè)方面。
在技術(shù)研發(fā)領(lǐng)域,企業(yè)逐漸認(rèn)識(shí)到盲目堆砌模型參數(shù)并非明智之舉。千億規(guī)模的模型并非萬能鑰匙,而 DeepSeek – R1 的成功案例有力地證明了,百億級(jí)模型通過算法優(yōu)化同樣能夠與更大規(guī)模的模型相媲美。
因此,未來的研發(fā)投資方向?qū)⒏嗟鼐劢褂趶?qiáng)化學(xué)習(xí)(RL)和模型蒸餾技術(shù)。
與單純擴(kuò)大數(shù)據(jù)量相比,RL 的自我進(jìn)化能力和蒸餾技術(shù)的生態(tài)價(jià)值在商業(yè)應(yīng)用中展現(xiàn)出更大的潛力。通過這些技術(shù),企業(yè)能夠在降低成本的同時(shí)提升模型性能,并拓展其應(yīng)用場(chǎng)景,從而走上一條高性價(jià)比的AI與業(yè)務(wù)融合之路。
在商業(yè)化路徑的選擇上,B 端市場(chǎng)成為優(yōu)先布局的重點(diǎn)。
與各行業(yè)的頭部企業(yè),如車企、醫(yī)院、銀行等展開合作,共同構(gòu)建行業(yè)專屬模型,并采用按效果付費(fèi)的模式,這不僅能夠?qū)崿F(xiàn)企業(yè)與客戶的深度綁定,還能促進(jìn)雙方在價(jià)值創(chuàng)造上的協(xié)同合作。
與此同時(shí),對(duì)于中小客戶群體,企業(yè)也不應(yīng)忽視其潛在的市場(chǎng)需求。通過提供開源模型和低代碼平臺(tái),為這些客戶提供便捷的 “AI 能力集裝箱”,能夠有效降低定制化成本,滿足長(zhǎng)尾市場(chǎng)的多樣化需求,進(jìn)而實(shí)現(xiàn)對(duì)整個(gè)市場(chǎng)的全面覆蓋。
構(gòu)建生態(tài)聯(lián)盟對(duì)于企業(yè)的發(fā)展同樣至關(guān)重要。
一方面,開源核心框架,例如 DeepSeek 開放 RL 訓(xùn)練工具鏈,能夠吸引開發(fā)者積極參與生態(tài)建設(shè),匯聚各方的智慧和資源,形成強(qiáng)大的技術(shù)合力。
另一方面,跨界聯(lián)盟的建立也必不可少。聯(lián)合芯片廠商(如華為)、云服務(wù)商(如阿里云)以及垂直領(lǐng)域的專業(yè)企業(yè),形成 “算力 – 模型 – 場(chǎng)景” 的鐵三角合作模式,能夠促進(jìn)產(chǎn)業(yè)鏈上下游的協(xié)同創(chuàng)新,打造一個(gè)合作共贏的產(chǎn)業(yè)生態(tài)環(huán)境。
從當(dāng)前的行業(yè)形勢(shì)來看,盡管中國(guó) AI 大模型在通用能力上暫時(shí)難以全面超越 OpenAI,但通過在垂直場(chǎng)景中的深耕細(xì)作以及生態(tài)的開放合作,完全有機(jī)會(huì)實(shí)現(xiàn)差異化的突圍。
展望 2025 年,中國(guó) AI 產(chǎn)業(yè)的發(fā)展目標(biāo)是打造一批 “小而美” 的行業(yè)模型。這些模型在特定領(lǐng)域內(nèi)形成對(duì)西方 “大而全” 模型的局部?jī)?yōu)勢(shì),通過在特定行業(yè)的深入應(yīng)用和優(yōu)化,逐步向通用智能領(lǐng)域滲透和拓展。
這一發(fā)展路徑不僅能夠充分發(fā)揮中國(guó)在特定領(lǐng)域的產(chǎn)業(yè)優(yōu)勢(shì),還能夠?yàn)槿?AI 產(chǎn)業(yè)的發(fā)展提供一種具有中國(guó)特色的創(chuàng)新模式和解決方案,推動(dòng) AI 技術(shù)在全球范圍內(nèi)的多元化發(fā)展和應(yīng)用。
六、寫在最后
DeepSeek 的技術(shù)革新與生態(tài)開放,使 AI 從 “巨頭的游戲” 變?yōu)?“全民共創(chuàng)”。隨著數(shù)字化與 AI 的相互催化,一個(gè) “技術(shù)越普及,數(shù)據(jù)越豐富,模型越智能” 的飛輪已然形成。
但對(duì)于產(chǎn)業(yè)AI的落地,還應(yīng)該更為審慎。盡管DeepSeek的出現(xiàn)打破了固有的算力、模型中的部分環(huán)節(jié)掣肘,但仍有很多問題尚待解決,比如模型的定向蒸餾,比如數(shù)據(jù)體系的構(gòu)建,再比如生態(tài)體系中各方利益的交叉配合等等,這早已經(jīng)不僅是一道技術(shù)命題,而更是一個(gè)行業(yè)向上的產(chǎn)業(yè)命題。
不過,能肯定的是,2025 年中國(guó) AI 大模型的產(chǎn)業(yè)潮水必然洶涌澎湃,勢(shì)不可擋。
作者:斗斗 編輯:皮爺 出品:產(chǎn)業(yè)家
本文由人人都是產(chǎn)品經(jīng)理作者【產(chǎn)業(yè)家】,微信公眾號(hào):【產(chǎn)業(yè)家】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!