??直擊黃仁勛GTC主題演講:全世界都誤解了Scaling Law
在2025年3月18日的GTC(GPU技術(shù)大會)上,英偉達(dá)CEO黃仁勛發(fā)表了主題演講,闡述了他對AI行業(yè)發(fā)展的最新見解,并宣布了一系列重要產(chǎn)品和技術(shù)的發(fā)布。本文將直擊黃仁勛的演講現(xiàn)場,解讀他關(guān)于Scaling Law(擴(kuò)展定律)的獨(dú)特觀點(diǎn),以及英偉達(dá)在GPU、AI推理加速、數(shù)據(jù)中心建設(shè)、機(jī)器人技術(shù)等領(lǐng)域的最新進(jìn)展。
AI行業(yè)的“超級碗”開始了,今天的主角是黃仁勛。
為了這個穿著黑色皮衣的男人,來自全球各地的科技行業(yè)創(chuàng)業(yè)者、從業(yè)者、開發(fā)者、科學(xué)家、投資人,還有英偉達(dá)的客戶、合作伙伴以及媒體都匯聚在圣何塞這座小城。
黃仁勛在GTC 2025的演講開始時間是當(dāng)?shù)貢r間3月18日上午10點(diǎn),但是清晨6點(diǎn),Doges AI創(chuàng)始人亞伯拉罕·戈麥斯(Abraham Gomez)就趕到了SAP Center,只為能“搶到一個前排的好位置”,當(dāng)時他排在全場第二。而到了早上8點(diǎn),場館外隊伍已經(jīng)排出了一公里。
音樂生成模型公司W(wǎng)ondera聯(lián)合創(chuàng)始人兼CEO Bill坐在觀眾席第一排,他特意穿著一件黑色皮衣,“只為致敬老黃”。
雖然現(xiàn)場觀眾熱情高漲,但黃仁勛并沒有像去年那樣——如同一個“搖滾明星”讓人異??駸?。
他今年更想證明自己的判斷,證明英偉達(dá)路線沒有問題,他全場說得最多的詞之一就是“scale up(擴(kuò)大規(guī)模)”。
去年GTC,黃仁勛認(rèn)為“未來是生成的”;而今年GTC,黃仁勛認(rèn)為“AI正處于拐點(diǎn)之中”。
這次,黃仁勛主要發(fā)布了三個方面的內(nèi)容:
第一,Blackwell GPU已全面投入生產(chǎn)。“產(chǎn)量增長令人難以置信,客戶需求也令人難以置信,”黃仁勛表示,“理由很充分,AI正處于拐點(diǎn)之中,由于推理人工智能以及推理人工智能系統(tǒng)和 Agentic 系統(tǒng)的訓(xùn)練,我們在人工智能中需要進(jìn)行的計算量要大得多?!?/p>
第二,搭載AI推理加速軟件Dynamo的Blackwell NVLink 72可提供NVIDIA Hopper 40倍的AI工廠性能。黃仁勛說:“隨著我們擴(kuò)展AI,推理將成為未來十年最重要的工作負(fù)載之一。”而在介紹Blackwell Ultra的強(qiáng)勁性能時,黃仁勛又說出了那句經(jīng)典臺詞:“買得越多,省得越多。甚至比這更好——買得越多,賺得越多?!?/p>
第三,英偉達(dá)制定年度路線圖,希望引導(dǎo)全球企業(yè)、開發(fā)者圍繞其規(guī)劃AI基礎(chǔ)設(shè)施。英偉達(dá)正在構(gòu)建三個AI基礎(chǔ)設(shè)施,分別用于云、企業(yè)和機(jī)器人。
此外,英偉達(dá)還發(fā)布了兩款新的GPU:一是Blackwell Ultra GB300,這是去年發(fā)布的Bl-a-c-k-w-e-ll的升級產(chǎn)品;二是全新一代的芯片架構(gòu)Vera Rubin以及Rubin Ultra。
黃仁勛對Scaling Law的信仰背后的秘密,就藏在歷經(jīng)十幾代架構(gòu)的芯片里。
總體而言,黃仁勛的演講一直在圍繞著“大模型推理的極限計算”。
在AI推理中,從單一用戶到大規(guī)模部署,需要在性能與收益之間找到最佳平衡。系統(tǒng)既要確保用戶的快速響應(yīng),又要通過提升硬件(如FLOPS、HBM帶寬)和優(yōu)化軟件(如架構(gòu)、算法)來提高整體吞吐量(Tokens per Second),以最大化規(guī)模化推理的經(jīng)濟(jì)價值。
關(guān)于Scaling Law放緩的問題,黃仁勛也提出了跟業(yè)內(nèi)截然相反的觀點(diǎn),他認(rèn)為:“由于新興的擴(kuò)展方法和技術(shù),人工智能的改進(jìn)速度比以往任何時候都快?!?/p>
黃仁勛最近的壓力并不小,在直播畫面之外,他在現(xiàn)場演講間隙多次喝水,演講最后,嗓音也略顯沙啞。
AI市場正從“訓(xùn)練”轉(zhuǎn)向“推理”,AMD、英特爾、谷歌、亞馬遜等科技巨頭推出專用推理芯片降低對英偉達(dá)的依賴。同時Cerebras、Groq、Tenstorrent等初創(chuàng)企業(yè)加速布局AI加速器,而DeepSeek等AI公司則希望通過優(yōu)化模型減少對昂貴GPU的需求。
這正是黃仁勛的壓力來源。
英偉達(dá)在訓(xùn)練市場占據(jù)超過90%的份額,隨著推理領(lǐng)域競爭越來越激烈,黃仁勛自然不想把推理市場拱手相讓,正如會場入口標(biāo)語:AI的下一站是什么?從這里開始。
以下是黃仁勛主題演講的重點(diǎn)內(nèi)容,由「甲子光年」在GTC現(xiàn)場整理。
1.全世界都誤解了Scaling Law
人工智能是英偉達(dá)近十年崛起的時代機(jī)遇。對于AI的前景,黃仁勛篤信不疑。本次GTC,黃仁勛一開場就將今年1月在CES上演講時用到的兩張PPT帶觀眾溫習(xí)了一遍:
第一張是AI的發(fā)展迭代進(jìn)程,黃仁勛將其分為Perception AI(感知AI)、Generative AI(生成AI)、Agentic AI(代理AI)、Physical AI(物理AI)四大階段。
第二張是Scaling Law的三個階段,黃仁勛將其總結(jié)為Pre-training Scaling(預(yù)訓(xùn)練擴(kuò)展)、Post-training Scaling(后訓(xùn)練擴(kuò)展)、Test-time Scaling / Long Thinking(測試時間擴(kuò)展/長思考)。
關(guān)于Scaling Law,黃仁勛提出了跟業(yè)內(nèi)截然相反的觀點(diǎn)。他聲稱,幾乎“全世界都誤解了”Scaling Law放緩的問題。黃仁勛認(rèn)為,事實上由于新興的擴(kuò)展方法和技術(shù),人工智能的改進(jìn)速度比以往任何時候都快。
黃仁勛是堅定的Scaling Law的“信仰者”,這種信仰建立在全世界人工智能的發(fā)展,都牢牢綁定于英偉達(dá)的GPU業(yè)務(wù)的基礎(chǔ)上。
黃仁勛隨后概述了能“一步步”推理的AI的發(fā)展,并提到了推理和強(qiáng)化學(xué)習(xí)的需求如何推動人工智能計算的需求。隨著人工智能正經(jīng)歷一個“拐點(diǎn)”,四大云服務(wù)提供商對GPU的需求正在激增。黃仁勛預(yù)計數(shù)據(jù)中心建設(shè)的價值將達(dá)到1萬億美元。
黃仁勛解釋道,NVIDIA CUDA-X GPU加速庫和微服務(wù)現(xiàn)在服務(wù)于每個行業(yè)。未來每家公司都會擁有兩家工廠:一家生產(chǎn)產(chǎn)品,一家生產(chǎn)AI。
AI目前正在走向世界,涉足機(jī)器人、自動駕駛汽車、工廠和無線網(wǎng)絡(luò)領(lǐng)域。黃仁勛表示,AI最早涉足的行業(yè)之一是自動駕駛汽車。他補(bǔ)充道:“我們開發(fā)的技術(shù)幾乎被每一家自動駕駛汽車公司使用”,無論是在數(shù)據(jù)中心還是汽車領(lǐng)域。
黃仁勛宣布了自動駕駛的一項重要進(jìn)展:美國最大的汽車制造商通用汽車正在采用 NVIDIA AI、模擬和加速計算來開發(fā)下一代汽車、工廠和機(jī)器人。他還宣布推出NVIDIA Halos,這是一款綜合安全系統(tǒng),將NVIDIA的汽車硬件和軟件安全解決方案系列與其在AV安全領(lǐng)域的尖端AI研究結(jié)合在一起。
接下來是數(shù)據(jù)中心和推理。
黃仁勛談到了數(shù)據(jù)中心,他提到NVIDIA Blackwell已全面投入生產(chǎn),并分享了來自眾多行業(yè)合作伙伴的系統(tǒng)。
對此黃仁勛心里美滋滋的,他還介紹了Blackwell如何支持極端擴(kuò)展,“我們想這樣做的原因是為了解決一個極端問題,這就是所謂的推理?!?/p>
他解釋道,推理就是生成token,這對企業(yè)至關(guān)重要。生成這些token的人工智能工廠必須以極高的效率和性能建造。隨著最新一代推理模型能夠思考和解決日益復(fù)雜的問題,對token的需求只會增長。
為了進(jìn)一步加速大規(guī)模推理,黃仁勛發(fā)布了NVIDIA Dynamo,這是一款用于加速和擴(kuò)展AI工廠中AI推理模型的開源軟件?!八举|(zhì)上是AI工廠的操作系統(tǒng)?!秉S仁勛說。
2.老黃好刀法:“買得越多,省得越多,賺得越多”
英偉達(dá)還發(fā)布了兩款新的GPU:一是Blackwell Ultra GB300,這是去年發(fā)布的Bl-a-c-k-w-e-ll的升級產(chǎn)品;二是全新一代的芯片架構(gòu)Vera Rubin以及Rubin Ultra。
Blackwell Ultra GB300將于今年下半年出貨,Vera Rubin將于明年下半年出貨,Rubin Ultra將于2027年下半年推出。
同時黃仁勛還公布了接下來的芯片路線圖,其下下一代芯片的架構(gòu)已經(jīng)被命名為Feynman,將于2028年問世。該名字可能以著名理論物理學(xué)家理查德·費(fèi)曼(Richard Feynman)命名。
英偉達(dá)每一代GPU架構(gòu),都會采用著名科學(xué)家的名字來命名。Bl-a-c-k-w-e-ll是英偉達(dá)在去年GTC發(fā)布的新架構(gòu),以美國統(tǒng)計學(xué)家David Harold Blackwell來命名。今年發(fā)布的最新一代架構(gòu)Rubin,是以“證實暗物質(zhì)存在”的女性科學(xué)先驅(qū)薇拉?魯賓(Vera Rubin)來命名。
從2004年至今的十一年時間里,英偉達(dá)已經(jīng)發(fā)布了十三代芯片架構(gòu),包括Currie(居里)、Tesla(特斯拉)、Fermi(費(fèi)米)、Kepler(開普勒)、Maxwell(麥克斯韋)、Pascal(帕斯卡)、Volta(伏特)、Turing(圖靈)、Ampere(安培)、Ada Lovelace(阿達(dá)·洛芙萊斯)、Hopper(霍珀)、Blackwell(布萊克威爾),以及今天的Rubin(魯賓),平均一年發(fā)布一代多。
黃仁勛對Scaling Law的信仰背后的秘密,就藏在這十幾代架構(gòu)的芯片里。
Blackwell Ultra是去年發(fā)布的Blackwell的升級版,但黃仁勛并沒有直接對比兩者的性能。英偉達(dá)曾向媒體透露,單個Ultra芯片將提供與Blackwell相同的20 petaflops的AI性能,但HBM3e內(nèi)存從192GB升級到了現(xiàn)在的288GB。與此同時,一個Blackwell Ultra DGX GB300“超級集群”將提供與Blackwell版本相同的288個CPU、576個GPU和11.5 exaflops的FP4計算能力,但內(nèi)存容量為從240TB升級到300TB。
英偉達(dá)一直將Blackwell Ultra與2022年發(fā)布的H100做對比。
根據(jù)官方數(shù)據(jù),Blackwell Ultra提供了1.5倍的FP4推理能力,可顯著加快“AI推理”,NVL72集群能夠運(yùn)行一個交互式的 DeepSeek-R1 671B模型,只需十秒就能提供答案,而H100則需要1.5分鐘。英偉達(dá)表示,這是因為Blackwell Ultra每秒可以處理1000個token,是H100的十倍。
英偉達(dá)還將提供一個名為GB300 NVL72的單機(jī)架,該機(jī)架提供1.1 exaflops的FP4、20TB的HBM內(nèi)存、40TB的“快速內(nèi)存”、130TB/秒的NVLink帶寬和14.4 TB/秒的網(wǎng)絡(luò)。
由于Blackwell Ultra相比H100的壓倒性優(yōu)勢,黃仁勛顯然也擔(dān)心客戶不再為H100買單,也擔(dān)心自己的銷售人員還賣不賣的出去H100。他調(diào)侃自己是“首席收入破壞者”,并表示在某些情況下,Hopper芯片其實也“還行”,但又補(bǔ)充道“情況并不多”。
接下來,黃仁勛說出了那句經(jīng)典臺詞:“買得越多,省得越多。它甚至比那更好?,F(xiàn)在,買得越多,賺得越多?!?/p>
英偉達(dá)的下一代架構(gòu)Rubin是一個全新架構(gòu)。黃仁勛說,“基本上,除了機(jī)架外,所有東西都是全新的?!?/p>
Rubin的FP4算力達(dá)到50千萬億次,高于Blackwell的20千萬億次浮點(diǎn)運(yùn)算。Rubin Ultra將采用單芯片,該芯片實際上包含兩個連接在一起的Rubin GPU,其性能達(dá)到100千萬億次FP4,是前者的兩倍,同時內(nèi)存接近四倍,達(dá)到1TB。
完整的NVL576 Rubin Ultra機(jī)架可提供15 exaflops的FP4推理和5 exaflops的FP8訓(xùn)練,英偉達(dá)稱其性能是今年推出的Blackwell Ultra機(jī)架的14倍。
如何在芯片之上擴(kuò)展到更大的系統(tǒng)?黃仁勛提到將光子學(xué)(一種依靠光而不是電信號傳輸數(shù)據(jù)的網(wǎng)絡(luò)技術(shù))緊密集成到加速計算基礎(chǔ)設(shè)施中。英偉達(dá)發(fā)布的Spectrum-X和NVIDIA Quantum-X硅光子網(wǎng)絡(luò)交換機(jī)融合了電子電路和光通信,使AI工廠能夠跨站點(diǎn)連接數(shù)百萬個GPU,同時降低能源消耗和運(yùn)營成本。
“這真是一項瘋狂的技術(shù)。”黃仁勛說道。與傳統(tǒng)方法相比,英偉達(dá)光子交換機(jī)集成了光學(xué)創(chuàng)新技術(shù),激光器數(shù)量減少了4倍,從而實現(xiàn)了3.5倍的功率效率、63倍的信號完整性、10倍的大規(guī)模網(wǎng)絡(luò)彈性和1.3倍的部署速度。
3.AI時代的計算機(jī)
除了云端芯片與數(shù)據(jù)中心外,英偉達(dá)還推出了搭載NVIDIA Grace Blackwell平臺的DGX個人AI超級計算機(jī),讓AI開發(fā)人員、研究人員、數(shù)據(jù)科學(xué)家和學(xué)生能夠在桌面上對大型模型進(jìn)行原型設(shè)計、微調(diào)和推理。
黃仁勛將其描述為“完美的圣誕禮物”,并同時推出了DGX Spark(前身為Project DIGITS)和DGX Station,后者是一款搭載NVIDIA Blackwell Ultra平臺的全新高性能NVIDIA Grace Blackwell桌面超級計算機(jī)。用戶可以在本地運(yùn)行這些模型,也可以將它們部署在NVIDIA DGX Cloud或任何其他加速云或數(shù)據(jù)中心基礎(chǔ)設(shè)施上。
“這是AI時代的計算機(jī)?!秉S仁勛說。
華碩、戴爾和惠普將與Boxx、Lambda和Supermicro一起銷售臺式電腦版本。
面向AI agent,黃仁勛還發(fā)布了具有推理能力的開源Llama Nemotron模型系列,為開發(fā)人員和企業(yè)提供一個業(yè)務(wù)就緒的基礎(chǔ),創(chuàng)建獨(dú)立工作或作為連接的團(tuán)隊解決復(fù)雜任務(wù)的高級AI agent。
NVIDIA Llama Nemotron推理系列基于Llama模型,提供按需人工智能推理功能。英偉達(dá)在培訓(xùn)后增強(qiáng)了新的推理模型系列,以改進(jìn)多步驟數(shù)學(xué)、編碼、推理和復(fù)雜的決策。
這一改進(jìn)過程使模型的準(zhǔn)確率較基礎(chǔ)模型提升高達(dá)20%,推理速度較其他領(lǐng)先的開放推理模型提升5倍,推理性能的提升意味著模型可以處理更復(fù)雜的推理任務(wù),增強(qiáng)決策能力,降低企業(yè)的運(yùn)營成本。
領(lǐng)先的Agentic AI平臺先驅(qū)——包括埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike、德勤、 IQVIA、微軟、SAP和ServiceNow——正在與 NVIDIA 合作開發(fā)其新的推理模型和軟件。
4.通用機(jī)器人時代已經(jīng)到來
黃仁勛將機(jī)器人描述為下一個價值10萬億美元的產(chǎn)業(yè),并表示到本世紀(jì)末,全球?qū)⒅辽偃鄙?000萬名工人。英偉達(dá)提供了一套完整的技術(shù),用于訓(xùn)練、部署、模擬和測試下一代機(jī)器人技術(shù)。
黃仁勛在一段視頻中宣布推出英偉達(dá)Isaac GR00T N1,這是世界上第一個開放、完全可定制的通用人形推理和技能基礎(chǔ)模型。他表示:“通用機(jī)器人時代已經(jīng)到來。借助英偉達(dá)Isaac GR00T N1和新的數(shù)據(jù)生成和機(jī)器人學(xué)習(xí)框架,世界各地的機(jī)器人開發(fā)人員將開辟人工智能時代的下一個前沿。”
英偉達(dá)還宣布發(fā)布全新Cosmos世界基礎(chǔ)模型,為物理AI開發(fā)引入開放且完全可定制的推理模型,并賦予開發(fā)人員對世界生成前所未有的控制權(quán)。
黃仁勛表示:“使用Omniverse來調(diào)節(jié)Cosmos,并使用Cosmos來生成無限數(shù)量的環(huán)境,使我們能夠創(chuàng)建有根有據(jù)、由我們控制,但同時又系統(tǒng)地?zé)o限的數(shù)據(jù)?!?/p>
他還介紹了與谷歌DeepMind和迪士尼研究中心共同開發(fā)的用于機(jī)器人模擬的Newton開源物理引擎,然后,一個名叫“藍(lán)色”的微型機(jī)器人從地板上的一個艙口鉆出來,向黃仁勛發(fā)出嘟嘟聲。
這個小家伙去年GTC就來過黃仁勛演講現(xiàn)場,今年它再次成功吸引了全場的目光,大家都紛紛拿出手機(jī)拍攝。
黃仁勛與迪士尼的機(jī)器人,來源:「甲子光年」拍攝
英偉達(dá)的發(fā)展史,就是不斷為其GPU尋找應(yīng)用場景的歷史。在十多年前,黃仁勛通過AlexNet找到了人工智能。而今天,黃仁勛為英偉達(dá)下一個十年尋找的場景,就是機(jī)器人與物理AI。
這一次,英偉達(dá)還能得償所愿嗎?
但黃仁勛顯然信心滿滿,會場內(nèi)回蕩的一首歌曲似乎就是黃仁勛的內(nèi)心獨(dú)白:
I’ll put my armor on show you how strong I am
我會全副武裝讓你看看我有多堅強(qiáng)
I’ll put my armor on I’ll show you that I am
我會嚴(yán)陣以待讓你看看我
I’m unstoppable
我勢不可擋
(封面圖及未標(biāo)注圖片來源:英偉達(dá)及「甲子光年」拍攝)
作者|趙健 蘇霍伊 編輯|王博 發(fā)自美國圣何塞
本文由人人都是產(chǎn)品經(jīng)理作者【甲子光年】,微信公眾號:【甲子光年】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!