對 DeepSeek 和智能下半場的幾條判斷
DeepSeek的出現(xiàn)不僅引發(fā)了技術(shù)圈的廣泛關(guān)注,也標(biāo)志著AI行業(yè)正式進入“智能下半場”。本文作者從多個角度深入分析了DeepSeek的技術(shù)突破、行業(yè)影響以及對未來智能發(fā)展的啟示。
從 24Q3 開始我們就一直在講 AI 的下半場,雖然 OpenAI o1 提出了 RL 敘事,但因為各種原因沒有破圈,DeepSeek R1 解了 RL 的謎題,推進整個行業(yè)進入了新范式,真正進入智能下半場。
市場上關(guān)于 DeepSeek 是什么、為什么的討論已經(jīng)很多了,接下來更有價值討論是 AI race 要怎么 play ?把過去半個月的思考總結(jié)了一下,希望成為探索下半場的 road map,每隔一段時間來復(fù)盤
01 DeepSeek 超越 OpenAI 了嗎?
DeepSeek 超越了 Meta Llama 毫無疑問,但相比 OpenAI、Anthropic 和 Google 這些第一梯隊 players 還有距離,比如 Gemini 2.0 Flash 成本比 DeepSeek 更低,能力也很強,且全模態(tài),外界低估了 Gemini 2.0 為代表的第一梯隊的能力,只是沒有開源而獲得這么炸裂轟動性的效果。
DeepSeek 很讓人興奮,但還不能稱作范式級創(chuàng)新,更準(zhǔn)確的表述是將之前 OpenAI o1 半遮半掩的范式開源,將整個生態(tài)推向很高滲透率。
從第一性原理角度,在 Transformer 這一代架構(gòu)下超越第一梯隊模型廠商是有難度的,同樣路徑下很難實現(xiàn)彎道超車可能,今天更期待有人能探索出下一代的智能架構(gòu)和范式。
DeepSeek 用一年時間追上了 OpenAI 和 Anthropic
02 DeepSeek 開啟新范式了嗎?
就像前面說的,嚴(yán)格意義上說,DeepSeek 沒有發(fā)明新范式。
但 DeepSeek 的重要意義在于幫助 RL 和 test time compute 這個新范式真正出圈。如果說 OpenAI 最初發(fā)布的 o1 是給行業(yè)出了一個謎語,DeepSeek 就是第一個公開解謎的人。
DeepSeek 發(fā)布 R1 和 R1-zero 之前,行業(yè)只有少部分人在實踐 RL 和 reasoning model,但 DeepSeek 給大家指明了路線圖,讓行業(yè)相信這樣做真的能提升智能,這對提升信心,吸引更多 AI researcher 轉(zhuǎn)向新范式的研究有巨大的幫助。
有人才進入,才有算法創(chuàng)新,有開源緊追才有更多計算資源投入。在 DeepSeek 之后,原本計劃不再發(fā)新模型的 OpenAI 接連發(fā)出 o3mini,并計劃繼續(xù)發(fā)布 o3,還考慮開源模型。Anthropic 和 Google 也會加快 RL 的研究。行業(yè)對新范式的推進因為 DeepSeek 加快,中小團隊也可以在不同的 domain 上嘗試 RL。
另外,reasoning model 的提升會進一步幫助 agent 落地,AI researcher 現(xiàn)在都因此對 agent 的研究和探索更有信心,因此也可以說 DeepSeek 開源 reasoning model 推進了行業(yè)向 Agent 的進一步探索。
所以 DeepSeek 雖然沒有發(fā)明新范式,但推進整個行業(yè)進入了新范式。
03 Anthropic 的技術(shù)路線和 R1 有什么不同?
從 Dario的訪談可以看出,Anthropic對R-1/reasoning model的理解,與O系列有些分歧,Dario覺得 base model 與 reasoning model應(yīng)該是個連續(xù)光譜,而非 OpenAI 這種獨立的模型系列。如果只做 O 系列會很快遇到天花板。
我一直想為什么 Sonnet 3.5的coding、reasoning 和 agentic能力一下子提升這么強,但 4o 一直沒追上?
他們在 pre training base model 階段就做了大量 RL 工作,核心還是把 base model 提上去,不然只靠 RL 提升 reasoning model 可能很容易把收益吃光。
04 DeepSeek 的轟動有必然,也有偶然
兩位早期 OpenAI 研究員寫的《為什么偉大不能被計劃》形容 DeepSeek 也很合適。
技術(shù)角度上,DeepSeek 有下面幾個亮點:
? 開源:開源這點很重要,OpenAI 從 GPT-3 開始轉(zhuǎn)為閉源公司后,第一梯隊三巨頭就不再公開技術(shù)細節(jié),拱手讓出了一個空白的開源生態(tài)位,但 Meta 和 Mistral 并沒有接穩(wěn)這個位置,DeepSeek 這次堪稱奇襲,在開源這塊大賽道一馬平川。
如果把轟動性打 100 分,智能提升貢獻 30 分,開源貢獻 70 分,之前 LLaMA 也開源但沒有這么轟動的效果,說明 LLaMa 智能水平不夠。
? 便宜:“Your margin is my opportunity” 這句話的含金量還在上升。
? 聯(lián)網(wǎng)+公開 CoT:對于用戶這兩個點分別都能帶來很好的用戶體驗,DeepSeek 把兩張牌同時出了,可以說是王炸,給到 C 端用戶的體驗和其他 Chatbot 完全不一樣。尤其是 CoT 透明,把模型思考過程公開了,透明能讓用戶對 AI 更信任,促進了破圈。不過,按理說 Perplexity 也是沖擊很大的,但 DeepSeek 服務(wù)端不穩(wěn)定,Perplexity 團隊快速反應(yīng)上線了 R-1 反而承接了很大 DeepSeek R-1 溢出的用戶。
? RL 泛化:雖然 RL 是 OpenAI o1 最先提出來的,但因為各種運營一直半遮半掩,滲透率并不高,DeepSeek R-1 很大意義推動了 reasoning model 范式的進程,生態(tài)接受度大幅提升。
DeepSeek 在技術(shù)上的探索投入是被這個智能成果值得更多人關(guān)注、討論的確定性因素,但 DeepSeek R1 推出的 timing 又讓這場轟動帶有偶發(fā)性:
- 過去美國一直講自己在基礎(chǔ)技術(shù)研究上大幅領(lǐng)先,但 DeepSeek 原生于中國國內(nèi),這本身也是一個亮點,這個過程中,又有很多美國科技大佬開始去宣揚 DeepSeek 挑戰(zhàn)了美國科技霸主的地位的論調(diào),DeepSeek 屬于被動卷進輿論戰(zhàn);
- DeepSeek R1 發(fā)布之前,OpenAI Stargate $500B 事件剛剛開始發(fā)酵,這種巨量投入和 DeepSeek 團隊智能產(chǎn)出效率對比太鮮明了,很難不引發(fā)關(guān)注、討論;
- DeepSeek 讓英偉達股價大跌又進一步讓輿論發(fā)酵,他們肯定也想不到自己成為了 2025 開年美股第一只黑天鵝;
- 春節(jié)是產(chǎn)品的練兵場,移動互聯(lián)網(wǎng)時代很多超級 App 都是在春節(jié)大爆發(fā)的,AI 時代也不例外。DeepSeek R1 恰好在春節(jié)前發(fā)布,大眾驚喜的是它的文字創(chuàng)作能力,而不是訓(xùn)練時候強調(diào)的 coding 和數(shù)學(xué)能力,文創(chuàng)更容易被大眾用戶有體感,也更容易 go viral。
05 誰受傷?誰受益?
可以把這個賽場上的 players 分 3 類:ToC、To Developer 以及 To Enterprise( to Government):
- ToC:Chatbot 肯定受沖擊最大,心智和品牌關(guān)注度被 DeepSeek 搶走了,ChatGPT 也不例外;
- 在開發(fā)者環(huán)節(jié)的影響很有限,我們看到有用戶用完之后說評論 r1 不好用不如 sonnet,Cursor 官方也說 Sonnet 還是 outperform,用戶 surprisingly 高比例都選擇 Sonnet,并沒有大幅遷移;
- 第三個維度,To Enterprise 和 To Government 的生意在于信任和需求理解,大型組織做決策的利益考慮很復(fù)雜,不會像 C 端用戶那么容易遷移。
再換個角度,從閉源、開源和算力的視角想這個問題:
短期大家會覺得閉源的 OpenAI/Anthropic/Google 更受沖擊:
- 技術(shù)神秘感被開源了,AI hype 里面最重要的神秘感的溢價被打破;
- 更現(xiàn)實的因素,市場認(rèn)為這幾家閉源公司的潛在客戶和市場規(guī)模被搶走了一些,GPU 投入的回本周期變長;
- 作為領(lǐng)頭羊的 OpenAI 在其中屬于最“吃虧”的那個,之前想捂著技術(shù)不開源,半遮半掩,希望多賺技術(shù)溢價的美夢無法實現(xiàn)了。
但中長期看,GPU 資源充裕的公司還是受益的,一方面是第二梯隊的 Meta 可以快速跟進新方法,Capex 更加 efficient,Meta 可能是很大受益者,另一方面是智能提升還需要更多探索,DeepSeek 開源把大家水平拉齊,進入全新探索又需要 10 倍甚至更大量級的 GPU 投入。
從第一性原理來想,對于 AI 智能產(chǎn)業(yè)來說,無論是發(fā)展智能還是應(yīng)用智能,從物理本質(zhì)上就必然要消耗海量算力,這是基礎(chǔ)定律決定的,不是技術(shù)優(yōu)化能完全規(guī)避的。
所以,無論是探索智能,還是應(yīng)用智能,即便短期有質(zhì)疑,中長期的算力需求也會爆炸,這也解釋了為什么馬斯克從第一性原理出發(fā),xAI 堅持?jǐn)U建集群,xAI 和 Stargate 背后的深層邏輯也許是一樣的。Amazon 等云廠商都宣布了要增加 Capex 指引。
我們就假設(shè)全球的 AI research 人才水平和認(rèn)知都拉齊,有更多 GPU 就可以做更多實驗探索?最后可能還是回到 compute 的競爭。
DeepSeek 光腳不怕穿鞋,沒有商業(yè)化訴求,專注 AGI 智能技術(shù)探索,開源這個動作對推動 AGI 進程推動意義很大,加劇了競爭,推動了開放性,頗有鯰魚效應(yīng)。
06 蒸餾能超越 SOTA 嗎?
有個細節(jié)點不確定,如果 DeepSeek 從 pre train 階段就大量使用蒸餾的 CoT 數(shù)據(jù),那做到今天效果不算驚艷,還是在第一梯隊巨頭的肩膀上獲得的基礎(chǔ)智能,然后再開源出來;但如果 pre train 階段沒有大量用蒸餾數(shù)據(jù),DeepSeek 從 0 做 pre train 做到今天的效果,那就堪稱驚艷了。
另外,蒸餾能否在 base model 超越 SOTA,應(yīng)該是不太可能的。但 DeepSeek R-1 非常強,猜測是 Reward model 做的非常好,如果 R-1 Zero 這條路徑靠譜,是有機會超越 SOTA。
07 No Moat !
Google 之前對 OpenAI 的一個評價:No Moat!這句話放在這里也很應(yīng)景。
DeepSeek 這一波 Chatbot 用戶又出現(xiàn)了大量遷移現(xiàn)象,給了市場一個很重要的啟發(fā):智能技術(shù)進步非常陡峭,階段性產(chǎn)品很難形成絕對壁壘。
不管是 ChatGPT/Sonnet/Perplexity 剛形成了心智和口碑,還是 Cursor、Windsurf 這類開發(fā)者工具,一旦有了更智能的產(chǎn)品,用戶對“上一代”智能的產(chǎn)品毫無忠誠度,今天不管是模型層還是應(yīng)用層都很難構(gòu)建護城河。
DeepSeek 這次也驗證了一件事:模型即應(yīng)用,DeepSeek 在產(chǎn)品形式上沒任何創(chuàng)新,核心就是智能+開源,我也不禁思考:在 AI 時代,任何產(chǎn)品和商業(yè)模式的創(chuàng)新都比不上智能的創(chuàng)新嗎?
08 DeepSeek 應(yīng)該承接這波 Chatbot 流量并做大嗎?
從 Chatbot 爆火到今天,通過 DeepSeek 團隊的反應(yīng)可以明顯感覺出來,DeepSeek 還沒想好怎么用這波流量。
而要不要接住、并積極運營這批流量這個問題的本質(zhì)是,偉大的商業(yè)公司和偉大的 research lab 能共存在一個組織嗎?
這件事非??简灳唾Y源分配、組織能力和戰(zhàn)略選擇,如果是字節(jié)、Meta 這類大公司,他們的第一反應(yīng)應(yīng)該都要接下來,也有一定組織基礎(chǔ)可以接下來,但 DeepSeek 作為一個 research lab 組織,承接這波巨量流量的壓力必然很大。
但同時也要想這一波 Chatbot 會是階段性流量嗎?Chatbot 是不是在未來智能探索的主線下?似乎感覺每個智能階段都有對應(yīng)的產(chǎn)品形態(tài),而 Chatbot 只是解鎖的其中一個早期形態(tài)。
對于 DeepSeek 來說,從未來 3-5 年視角看,如果今天不去承接 Chatbot 流量,會不會是一種 miss?萬一哪天跑出規(guī)模效應(yīng)?如果 AGI 最終實現(xiàn)了,又會是什么載體來承接?
09 下一個智能突破的 Aha moment 從哪來?
一方面,第一梯隊的下一代模型很關(guān)鍵,但今天我們又處在 Transformer 的極限邊界上,第一梯隊能否拿出代際提升的模型也不確定。OpenAI、Anthropic 和 Google 作為回應(yīng)發(fā)出來好 30-50%的模型可能都不夠挽回局勢,因為他們資源多了 10-30 倍。
另一方面, Agent 落地比較關(guān)鍵,因為 Agent 需要做長距離多步驟推理,如果模型好 5-10%,領(lǐng)先的效果就會被放大很多倍,所以 OpenAI、Anthropic 和 Google 一方面要做 Agent 產(chǎn)品落地,full stack 集成模型+Agent 產(chǎn)品,就像 Windows+Office,二是也要 show 出來更強大的模型,比如 O3 完整版、Sonnet 4/3.5 opus 為代表的下一代模型。
在技術(shù)不確定性下,最寶貴的是天才 AI researchers,任何想要探索 AGI 的組織都要投入資源更激進的 bet on next paradigm,尤其是在今天 pre training 階段已經(jīng)被拉齊的背景下,要有好的人才+充裕資源,探索下一個智能涌現(xiàn)的 Aha moment。
10 DeepSeek 這一波讓我對中國 AI 人才更有信心,非常鼓舞
最后,希望技術(shù)無國界。
作者:李廣密 編輯:penny,Siqi
本文由人人都是產(chǎn)品經(jīng)理作者【海外獨角獸】,微信公眾號:【海外獨角獸】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
看到一個說法R1走的不是獎勵模型路線,是推演返回自行糾錯的