DeepSeek啟示錄:偉大不能被計(jì)劃

0 評(píng)論 75 瀏覽 0 收藏 18 分鐘

在AI領(lǐng)域,DeepSeek的崛起如同一顆新星,迅速吸引了全球的目光。短短一年半的時(shí)間,它不僅在技術(shù)上取得了令人矚目的突破,還以極低的成本推出了性能卓越的AI模型,直接挑戰(zhàn)了行業(yè)巨頭OpenAI。本文將深入剖析DeepSeek的成功秘訣,探討其背后的技術(shù)創(chuàng)新、獨(dú)特的團(tuán)隊(duì)文化以及戰(zhàn)略選擇,并分析其對(duì)AI行業(yè)和全球科技競(jìng)爭(zhēng)格局的深遠(yuǎn)影響。

「國(guó)運(yùn)級(jí)科技突破」「美國(guó)的斯普特尼克時(shí)刻」「AI珍珠港事件」……DeepSeek刮起的「最炫民族AI風(fēng)」,遠(yuǎn)沒(méi)有停下來(lái)的跡象。

美國(guó)方面對(duì)DeepSeek以國(guó)家安全調(diào)查名義展開(kāi)「獵巫」,又為其輿論熱度火上澆了油。

看上去,DeepSeek才是「春節(jié)檔」最大贏家:成立僅1年半的DeepSeek于無(wú)聲處釀出了驚雷,堪比作「魔童鬧?!?;使出降龍十八掌直接重創(chuàng)納斯達(dá)克的DeepSeek提振了國(guó)人信心,不啻為「?jìng)b之大者」;掀起AI領(lǐng)域「算力起義」的DeepSeek改寫了AI權(quán)力游戲規(guī)則,配得上被「封神」。

正因如此,在國(guó)內(nèi)外輿論場(chǎng),DeepSeek幾乎被各種震驚體圍裹。

▲《黑神話·悟空》制作人馮驥將DeepSeek-R1視作國(guó)運(yùn)級(jí)別的科技成果

在宏大敘事框架下,DeepSeek的異軍突起,很容易被人拿來(lái)跟華為突破美國(guó)封堵重新推出「爭(zhēng)氣機(jī)」5G手機(jī)華為Mate60 Pro并論,跟大國(guó)科技崛起的話語(yǔ)綁定。

在芯片法案與TikTok剝離法案已成中美科技競(jìng)賽烈度直觀反映的當(dāng)下,這類解讀在所難免。

但不能因此就抹殺DeepSeek奇跡中「去Nationalism」的部分,要看到,DeepSeek能變成眼下的DeepSeek,跟很多具體因素有關(guān),如梁文鋒的極致技術(shù)理想主義,如DeepSeek人才使用的反經(jīng)驗(yàn)主義。

也正是DeepSeek身上的多重獨(dú)特性,使得它可以像荊棘花那般不懼凜風(fēng)與涸土地盛開(kāi)。

在我看來(lái),如果要用一句話總結(jié)DeepSeek啟示錄的精髓,那就是:偉大不能被計(jì)劃。

01

「?jìng)ゴ蟛荒鼙挥?jì)劃」,言下之意是,不要試圖去設(shè)計(jì)規(guī)劃好一切,很多事情本就是「無(wú)心插柳」的結(jié)果。

DeepSeek能同時(shí)登頂蘋果App Store中美下載排行榜第一,就是最直觀的驗(yàn)證。它的崛起之路,有著太多的「讓人意想不到」。

在9個(gè)月前,許多人印象中的國(guó)內(nèi)AI頭部玩家,還是以BAT和字節(jié)為代表的大廠和AI大模型六小虎(智譜AI、月之暗面、百川智能、MiniMax、階躍星辰、零一萬(wàn)物)。

誰(shuí)能想到,「名少見(jiàn)經(jīng)傳」的DeepSeek 能戳穿性價(jià)比天花板,證明「明明是主流玩家的電影,我卻偏偏要有姓名」呢?

在1個(gè)多月前,很多人認(rèn)知中的OpenAI挑戰(zhàn)者,依舊在硅谷——紅杉資本此前就認(rèn)為,現(xiàn)在AI領(lǐng)域是五強(qiáng)爭(zhēng)霸:微軟+OpenAI,亞馬遜+Antropic,谷歌,Meta和xAI。

誰(shuí)能想到,DeepSeek能用OpenAI僅約1/10的預(yù)訓(xùn)練成本,就推出了性能可與GPT-4o、Claude 3.5 Sonnet等頂尖閉源模型相匹敵的DeepSeek-V3呢?

在10多天前,有些人仍然會(huì)認(rèn)為,DeepSeek-V3只是曇花一現(xiàn),連DeepSeek都很難再?gòu)?fù)制DeepSeek。

誰(shuí)能想到,DeepSeek又掏出了成本依舊低廉、性能更加強(qiáng)大的DeepSeek-R1(性能可對(duì)標(biāo)OpenAI o1正式版,API服務(wù)定價(jià)則要低上27-55倍),直接震驚歐美科技界呢?

▲DeepSeek-R1引發(fā)美股地震后,引起國(guó)內(nèi)外媒體廣泛關(guān)注

事實(shí)上,就在DeepSeek-V3發(fā)布時(shí),依然有國(guó)內(nèi)專家將Deepseek視作小米Su7,「神似某捷的外型、單層的、民用級(jí)剎車卡鉗、大概其的隔音……雖然一上賽道跑幾圈剎車就嚴(yán)重衰減,雖然里里外外都是蔚小理玩過(guò)的東西,沒(méi)有技術(shù)和形態(tài)突破?!褂袊?guó)外人士認(rèn)為DeepSeek雖然拿出了「30美元iPhone」,但那只是平替。

但DeepSeek-R1用特朗普震驚、山姆·奧特曼嘆服、馬斯克「內(nèi)涵」的反應(yīng)證明了,它確實(shí)不是池中物。

而今,不少國(guó)內(nèi)網(wǎng)友儼然用滿屏驚嘆擺成了四郎的表情包:你還有多少驚喜是朕不知道的?

02  

「?jìng)ゴ蟛荒鼙挥?jì)劃」,也是因?yàn)?,很多「?jìng)ゴ蟆沟氖挛镆婚_(kāi)始可能是「微小」的。

DeepSeek能不能承載起「國(guó)運(yùn)級(jí)成果」的名頭,興許還有爭(zhēng)議,但它確實(shí)當(dāng)?shù)闷稹干衿妗苟帧?/p>

DeepSeek-R1究竟厲害在哪?懂技術(shù)的人興許張口就是一堆名詞:合成數(shù)據(jù)、知識(shí)蒸餾、FP8低精度、稀疏模型、MoE、多頭注意力機(jī)制……

這些技術(shù)未必是首創(chuàng),但DeepSeek能利用既有技術(shù),實(shí)現(xiàn)訓(xùn)練量效比、算力能效比的極致提升,也是現(xiàn)象級(jí)突破。

都說(shuō)「多少輛馬車相加,都加不出一輛汽車來(lái)。」喬布斯當(dāng)年發(fā)明iPhone,不是在功能機(jī)上疊加MP3、攝像機(jī)等功能,而是用觸屏體驗(yàn)+軟硬件一體化重新定義了手機(jī)。DeepSeek的難得之處也在于「重新定義」——它打破了路徑依賴,重新定義了算力提升方式。

有人這樣比喻:若是把提升算力視作蓋樓,那OpenAI就是狂堆磚塊(芯片硬件),DeepSeek則是依托發(fā)明鋼筋混凝土(數(shù)學(xué)框架創(chuàng)新)來(lái)重塑建造方式。

OpenAI讓大模型研發(fā)變成了比誰(shuí)磚塊多的比賽,DeepSeek則讓大模型研發(fā)變成了比誰(shuí)建筑方式更高效的PK。

▲有網(wǎng)友這樣調(diào)侃OpenAI跟DeepSeek的差別。

DeepSeek只是個(gè)200多人的公司,卻能挾工程能力優(yōu)勢(shì)用算法優(yōu)化「發(fā)明」出算力倍增器,干出很多國(guó)內(nèi)外大廠都沒(méi)干出的事來(lái),這不免讓人想起凱文·凱利在《5000天后的世界》中的那句話——「未來(lái)最成功的那個(gè)公司,必然是今天還默默無(wú)聞的、在社交媒體領(lǐng)域外的某個(gè)小公司?!?/p>

小就是大。在大公司成功的經(jīng)驗(yàn)成為它們的桎梏時(shí),創(chuàng)業(yè)公司卻可以以好奇心驅(qū)動(dòng)的創(chuàng)新動(dòng)能、扁平無(wú)層級(jí)的組織架構(gòu),展現(xiàn)出更大的創(chuàng)新勢(shì)能來(lái)。

DeepSeek就是典型。AI創(chuàng)業(yè)公司的高強(qiáng)活力跟梁文鋒的高維認(rèn)知疊合后,產(chǎn)生的化學(xué)反應(yīng)十分驚人。

梁文鋒對(duì)AGI(通用人工智能)的技術(shù)信仰,對(duì)中美AI差距本質(zhì)是「原創(chuàng)與模仿之差」的清醒洞見(jiàn),對(duì)「閉源的護(hù)城河是短暫的,OpenAI閉源也無(wú)法阻止被趕超」的前瞻判斷,本就體現(xiàn)了高于行業(yè)的認(rèn)知能力。

DeepSeek采用無(wú)層級(jí)的靈活協(xié)作機(jī)制,重潛力和好奇心不重行業(yè)經(jīng)驗(yàn)的招聘標(biāo)準(zhǔn),開(kāi)源的生態(tài)戰(zhàn)略,都與此有關(guān),也放大了其勢(shì)能。

因而,DeepSeek可以在朱嘯虎式判斷廣受推崇的時(shí)下,篤定「不做應(yīng)用,專注大模型研究」的長(zhǎng)期主義戰(zhàn)略,可以在OpenAI路線大行其道的情況下,擁抱更高效更開(kāi)放的AI發(fā)展道路。

為什么是DeepSeek?部分答案就藏在其中。

03

「?jìng)ゴ蟛荒鼙挥?jì)劃」,也意味著,那些偶然性與獨(dú)特性不該被忽略。

行業(yè)專家楊寬老師就說(shuō):當(dāng)OpenAI沉迷于暴力堆料時(shí),DeepSeek團(tuán)隊(duì)在玩「算力俄羅斯方塊」——把每個(gè)CUDA核心的價(jià)值壓榨到小數(shù)點(diǎn)后四位,就硬件利用率而言,硅谷利用GPU群組通信損耗技術(shù)達(dá)到了30%-40%,DeepSeek則利用自研MoE+動(dòng)態(tài)路由算法達(dá)到了78%,「這不是技術(shù)差距,而是工程思維的代際碾壓?!?/p>

這背后就離不開(kāi)DeepSeek團(tuán)隊(duì)提出的MLA架構(gòu)創(chuàng)新,它借此將顯存占用降至傳統(tǒng)方法的5%-13%。背后的背后則是一年輕研究員的突然靈感和突發(fā)奇想。

他還講到,梁文鋒將量化交易思維注入AI訓(xùn)練當(dāng)中:風(fēng)險(xiǎn)對(duì)沖(用多模態(tài)數(shù)據(jù)構(gòu)建「投資組合」)、高頻調(diào)參(在行業(yè)標(biāo)準(zhǔn)72小時(shí)/次的前提下,每2小時(shí)優(yōu)化一次超參數(shù))、動(dòng)態(tài)止損(自動(dòng)終止低效訓(xùn)練分支),這套「華爾街煉金術(shù)」使得DeepSeek的每次訓(xùn)練都像在玩《文明6》的科技樹(shù)速通。

這很容易讓人想到肯尼斯·斯坦利和喬爾·雷曼在《為什么偉大不能被計(jì)劃》中舉的例子:發(fā)明飛機(jī)的萊特兄弟,最早其實(shí)是自行車制造商;真空管是早期計(jì)算機(jī)的奠基性零件,但真空管的誕生與計(jì)算機(jī)毫無(wú)關(guān)系……

做量化交易起家的梁文鋒,創(chuàng)造出了「心價(jià)比」超強(qiáng)的AI大模型,又為其新添了案例。

▲被很多歪果仁稱作「東方神秘力量」的DeepSeek,發(fā)展路徑有其獨(dú)特性。

DeepSeek被津津樂(lè)道的,還有其開(kāi)源模式:在OpenAI背離初心變成CloseAI的背景下,DeepSeek變成了真正Open的AI;在OpenAI把開(kāi)發(fā)者當(dāng)「數(shù)字佃農(nóng)」時(shí),DeepSeek用開(kāi)源協(xié)議發(fā)動(dòng)「AI土地革命」……這也是其了不起的地方。

這也跟梁文鋒的技術(shù)理想主義氣質(zhì)緊密相關(guān)。換個(gè)人,可能又是師山姆·奧特曼長(zhǎng)技以制競(jìng)爭(zhēng)對(duì)手的打法了。

梁文鋒說(shuō):「創(chuàng)新都是自己產(chǎn)生的,不是刻意安排的?!?/p>

這相當(dāng)于拍了拍肯尼斯·斯坦利們,并向他們表達(dá)了認(rèn)同。因?yàn)榭夏崴埂に固估f(shuō):真正的偉大是計(jì)劃不出來(lái)的,跟著好奇心一步一步走,才是成就非凡的正確路徑。

04  

「?jìng)ゴ蟛荒鼙挥?jì)劃」,所以那些看似很小的種子,沒(méi)準(zhǔn)也能「開(kāi)出花,伸出新長(zhǎng)的枝椏」;那些在邊緣地帶、外圍區(qū)域、隱秘角落的探索,興許也能「小力出奇跡」。

跟國(guó)外的GAFA(谷歌蘋果臉書亞馬遜)和英偉達(dá)、國(guó)內(nèi)的BAT一樣,DeepSeek不是計(jì)劃出來(lái)的,而是在適宜土壤上長(zhǎng)成的。

既然創(chuàng)新是激發(fā)好奇心、激活創(chuàng)造性后擺脫路徑依賴的產(chǎn)物,而非計(jì)劃出來(lái)的結(jié)果,那對(duì)于創(chuàng)新應(yīng)有的呵護(hù)與激勵(lì),也不該是回到路徑依賴中去,而是為那些好奇心與創(chuàng)造性提供良好的制度環(huán)境,包括包容氛圍、試錯(cuò)空間。

就目前看,DeepSeek走紅后,輿論場(chǎng)中有些反應(yīng)就值得警惕,這其中的某些反應(yīng),更進(jìn)一步通向的就是那種對(duì)「計(jì)劃」的路徑依賴。具體來(lái)說(shuō)就包括:

一,將DeepSeek的突破導(dǎo)入Nationalism的語(yǔ)境中,認(rèn)為要將其作為「AI國(guó)家隊(duì)」來(lái)加以收編、大力扶持。

「自創(chuàng)生」的DeepSeek,不需要揠苗助長(zhǎng),只需要適合創(chuàng)新的氣候土壤。

仔細(xì)看會(huì)發(fā)現(xiàn),從《黑神話·悟空》到宇樹(shù)科技的機(jī)器狗再到DeepSeek在StyleCtrl類別中排第一的大模型,都誕生在杭州。

這不是偶然。通常而言,市場(chǎng)底色足-民營(yíng)企業(yè)多-創(chuàng)新氛圍濃-經(jīng)濟(jì)活力足-發(fā)展機(jī)遇廣-成為未來(lái)科技中心概率大,是一體的。

尊重市場(chǎng)、鼓勵(lì)創(chuàng)新、擁抱開(kāi)放、包容失敗,培育適宜創(chuàng)新的市場(chǎng)生態(tài),就可能會(huì)有更多企業(yè)——包括中小民營(yíng)企業(yè),像DeepSeek一樣冒出來(lái)。

倒是那些以關(guān)懷為名的干預(yù),以擔(dān)當(dāng)為由的裹挾,可能會(huì)抑制其活力。

二,以「干翻硅谷,單挑華爾街」的「厲害了,我的DS」態(tài)度,將其推向大時(shí)代的旋流中。

在美國(guó)持續(xù)升級(jí)對(duì)華AI芯片限制的背景下,DeepSeek利用華為芯片、中國(guó)本土AI人才、更低的算力成本研發(fā)出了性能領(lǐng)先的大模型,激發(fā)民族自信心和自豪感很正常,被寄予打破卡脖子局面的厚望也很正常。

但這不應(yīng)導(dǎo)向?qū)eepSeek的無(wú)意識(shí)捧殺,更不應(yīng)通往對(duì)「脫鉤斷鏈論」的里應(yīng)外合。

把DeepSeek的突破視作「國(guó)運(yùn)級(jí)」的,個(gè)中的揚(yáng)眉吐氣心態(tài)可以理解,饒是如此,也該盡量避免把企業(yè)跟「干翻」「單挑」之類的字眼關(guān)聯(lián),否則很可能迎合外部的那些「××威脅論」,將其無(wú)形中推到靶子位置。

▲DeepSeek眼下正遭到美國(guó)方面以國(guó)家安全調(diào)查為名的「獵巫」。

往大了說(shuō),我們不該在「妄自菲薄」和「妄自尊大」兩極間橫跳。

《暗知識(shí)》作者王維嘉就認(rèn)為,從技術(shù)格局來(lái)看,盡管 DeepSeek 的成果縮小了中美在人工智能技術(shù)上的差距,但中美人工智能整體格局尚未被撼動(dòng)。

他覺(jué)得,「在人工智能技術(shù)的幾個(gè)關(guān)鍵方面,芯片領(lǐng)域中國(guó)仍與美國(guó)存在較大差距;在算法突破方面,過(guò)去十年間,從 2012 年的 alexnet 到2017 年的 transformer,再到 2022 年的 ChatGPT 以及后續(xù)的思維鏈、RAG 和推理訓(xùn)練等重大突破,大多發(fā)生在美國(guó),法國(guó)的 Mistral 公司也有少量貢獻(xiàn),DeepSeek 的貢獻(xiàn)占比約為 5%,但這已然十分了不起。」

接下來(lái),我們需要更多DeepSeek出來(lái)去縮小差距,而不是在捧殺DeepSeek中掐滅火種。

05

說(shuō)到底,DeepSeek的勝利,是對(duì)《為什么偉大不能被計(jì)劃》中那個(gè)觀點(diǎn)的最佳注解——「在探索未知領(lǐng)域的過(guò)程中,保持對(duì)有趣事物的開(kāi)放性,在搜索到足夠數(shù)量的踏腳石之后,偉大的成就自然就會(huì)與我們不期而遇?!?/p>

DeepSeek邁出了AI發(fā)展史上的重要一步,免不了被置于未來(lái)大國(guó)博弈、科技競(jìng)爭(zhēng)的框架下打量。

但無(wú)論如何,別忘了——

DeepSeek的創(chuàng)新不是計(jì)劃出來(lái)的,DeepSeek的創(chuàng)新被看到后也不需要「計(jì)劃」來(lái)裹挾。

文 | 佘宗明

本文由人人都是產(chǎn)品經(jīng)理作者【數(shù)字力場(chǎng)】,微信公眾號(hào):【數(shù)字力場(chǎng)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!