“我只想讓大家知道,此刻站在這里,全憑臨場發(fā)揮?!北本r間3月19日凌晨1點(diǎn),英偉達(dá)CEO黃仁勛迎著臺下上萬名觀眾的歡呼聲,開啟了2025年度GTC大會的主題演講。
沒有預(yù)備發(fā)言稿,也沒有提詞器,但黃仁勛在兩個多小時的演講可謂“信息量爆炸”:Blackwell進(jìn)展、AI市場判斷、機(jī)器人、光電共封裝CPO新品…… 這些備受業(yè)界關(guān)注的焦點(diǎn),英偉達(dá)一件不落地給出了最新官方回應(yīng)。
顯然,臨場發(fā)揮的黃仁勛必須“有備而來”,抓住這一令全球目光聚焦的時刻,不僅亟需證明英偉達(dá)本身,更要證明英偉達(dá)對AI押下的賭注是正確的。
信號一:Agentic AI時代,計(jì)算需求或?qū)⒈┰?/strong>
撥開GTC演講的大幕,黃仁勛最先也最想釋放出的信號與AI市場直接相關(guān)。
人工智能真正進(jìn)入全球公眾視野,大約是在十年前。在這十年光景里,人工智能經(jīng)歷了不同階段的變化。一開始是感知人工智能,包括計(jì)算機(jī)視覺、語音識別;接著是過去五年逐漸受到關(guān)注的生成式人工智能:在一個模態(tài)與另一個模態(tài)之間進(jìn)行轉(zhuǎn)換,例如文生圖、圖生文、文生視頻。
“生成式人工智能從根本上改變了計(jì)算的方式,從檢索式計(jì)算模型轉(zhuǎn)變?yōu)樯墒接?jì)算模型。”黃仁勛表示。
此次GTC大會,“Agentic AI”(代理式AI)成為英偉達(dá)頻頻提及的關(guān)鍵詞。黃仁勛對其進(jìn)行了解釋:“Agentic AI”從根本上說,是指具備“自主性”(agency)的AI,它能夠感知和理解環(huán)境的上下文,很重要的一點(diǎn)是它能進(jìn)行推理,思考如何回答或解決問題,制定并執(zhí)行計(jì)劃,還能使用工具。黃仁勛認(rèn)為,Agentic AI 的基礎(chǔ)是推理。
“今年的GTC被稱為AI界的‘超級碗’。唯一的區(qū)別在于,在這場‘超級碗’里,每個人都是贏家。”黃仁勛做出如此比喻,透露出其對AI前景的樂觀態(tài)度。
以DeepSeek為代表的開源推理大模型的問世,曾一度令英偉達(dá)遭受資本市場的質(zhì)疑。今年2月,黃仁勛首次正面表達(dá)了對于DeepSeek問世將利好英偉達(dá)未來的信心。在本次GTC大會上,黃仁勛再次對AI需求問題作出回應(yīng):
“過去這一年,幾乎整個世界在這方面都看走眼了。AI的計(jì)算需求及其擴(kuò)展定律其實(shí)更具韌性,甚至可以說是超加速。由于Agentic AI、推理的出現(xiàn),如今我們所需的計(jì)算量比一年前的預(yù)期至少高出100倍?!?/p>
上述判斷如何得出?答案藏在被英偉達(dá)視為人工智能基本構(gòu)成單元的“token”身上。
黃仁勛表示,現(xiàn)在我們有了能逐步推理的AI,它利用“Chain of Thought”(思維鏈)、取多種解法里最優(yōu)和一致性檢查等多種技術(shù),一步一步地分解問題,進(jìn)行推理。由此可以想見,AI所生成的token數(shù)量會急劇增多。
那么,前文的“100倍”具體意味著什么?黃仁勛用數(shù)字給出解釋:這也許是生成了100倍的token數(shù)量;又或者,模型本身更復(fù)雜,只生成10倍的token,但若想讓模型具備交互性、實(shí)時性,就要把計(jì)算速度再提高10倍。這樣一來,10倍的token、10倍的速度,就相當(dāng)于需要100倍的計(jì)算量。因此,推理所需的計(jì)算量遠(yuǎn)超以往。
信號二:芯片路線圖按節(jié)奏推進(jìn)
如果AI計(jì)算需求持續(xù)呈倍數(shù)級增長,英偉達(dá)如何應(yīng)對?
“英偉達(dá)未來幾年的路線圖,大約保持一年一次的迭代節(jié)奏,就像時鐘滴答一樣穩(wěn)定?!秉S仁勛表示。
借助今年GTC大會,黃仁勛提前透露了一張涉及未來幾年的芯片架構(gòu)路線圖,將每年升級全棧AI系統(tǒng)、發(fā)布一條新產(chǎn)品線:2025年下半年推出Blackwell Ultra,2026年下半年推出Rubin,2027年下半年推出Rubin Ultra,預(yù)計(jì)2028年推出采用下一代HBM的Feynman平臺。
具體來看,英偉達(dá)于去年3月發(fā)布了AI芯片與超級計(jì)算平臺Blackwell架構(gòu),并推出GB200芯片。此次黃仁勛表示,目前Blackwell已經(jīng)全面投產(chǎn)。今年,Blackwell新一代芯片的正式名字為Blakwell Ultra。據(jù)悉,Blackwell Ultra由臺積電N4P工藝的Blackwell GPU+Grace CPU+更大容量的HBM封裝而來。英偉達(dá)表示,Blackwell Ultra也適用于AI智能體,以及用于訓(xùn)練機(jī)器人和汽車自動駕駛的“物理AI”。
此外,英偉達(dá)公布了繼Hopper、Blackwell之后的下一代GPU架構(gòu)Rubin——以在暗物質(zhì)研究領(lǐng)域取得突破性進(jìn)展的天文學(xué)家Vera Rubin命名,以及Rubin Ultra的計(jì)劃配置。據(jù)悉,Rubin平臺擁有全新的CPU和網(wǎng)絡(luò)架構(gòu),性能將是Hopper的兩倍,且內(nèi)存更大,將為AI應(yīng)用提供更強(qiáng)大的支持。Rubin Ultra系統(tǒng)由Rubin Ultra GPU和Vera CPU組成。Rubin Ultra由4塊掩模尺寸的GPU組成,擁有1TB HBM4e內(nèi)存,F(xiàn)P4峰值推理能力可達(dá)100PFLOPS。
值得一提的是,此次黃仁勛還宣布了Rubin之后的下一代AI芯片架構(gòu)“Feynman”。該名稱源自對量子計(jì)算領(lǐng)域有著重要貢獻(xiàn)的科學(xué)家Richard Phillips Feynman。
提前公布未來三年路線圖的原因何在?黃仁勛給出的解釋是,現(xiàn)在要建的是AI工廠,這需要多年規(guī)劃。
“這可不是買臺筆記本電腦那么簡單,也不是一筆隨心所欲的支出,而是必須經(jīng)過對土地、電力、資金、工程團(tuán)隊(duì)等各方面的長遠(yuǎn)計(jì)劃?!秉S仁勛在演講中說道, “所以我們必須給出一個2—3年的預(yù)告,而不是等到某個月份突然說‘嘿,下個月又有一個超棒的新系統(tǒng)’”。
信號三:關(guān)于未來還有更多“宏大敘事”
AI行業(yè)并非一個單點(diǎn),而是從技術(shù)到設(shè)施再到應(yīng)用的一個立體面。因此,作為AI行業(yè)走在前面的那一批,英偉達(dá)的故事只講“芯片”還遠(yuǎn)遠(yuǎn)不夠。此次,黃仁勛從一些側(cè)面?zhèn)鬟_(dá)出英偉達(dá)在整個AI產(chǎn)業(yè)鏈的布局。
從上游技術(shù)層面來看,AI光通信時代背景下,數(shù)據(jù)中心規(guī)模持續(xù)擴(kuò)大,帶寬容量與高速數(shù)據(jù)傳輸速率的需求明顯增加。光電共封裝(Co-Packaged Optics,CPO)作為一種新型的光電子集成技術(shù),受到產(chǎn)業(yè)界眾多頭部企業(yè)關(guān)注。此次,英偉達(dá)正式發(fā)布硅光子網(wǎng)絡(luò)交換機(jī)Spectrum-X和Quantum-X,目的是推動AI工廠擴(kuò)展到數(shù)百萬GPU級別。值得關(guān)注的是,英偉達(dá)的硅光生態(tài)系統(tǒng)伙伴包括了臺積電、康寧、Browave、Coherent等知名公司。
“AI工廠是一種超大規(guī)模的新型數(shù)據(jù)中心,必須采用全新的網(wǎng)絡(luò)基礎(chǔ)設(shè)施才能跟上它的發(fā)展步伐。”黃仁勛表示,英偉達(dá)將硅光直接集成到交換機(jī)中,打破了超大規(guī)模和企業(yè)網(wǎng)絡(luò)的舊有限制,為百萬GPU AI工廠打開大門。”據(jù)悉,英偉達(dá)的硅光交換機(jī)創(chuàng)新地集成了光器件,減少了4倍的激光器數(shù)量,與傳統(tǒng)方法相比,能源效率提高到3.5倍,信號完整性提高到63倍,大規(guī)模組網(wǎng)可靠性提高到10倍,部署速度提高到1.3倍。
在下游應(yīng)用層面,機(jī)器人賽道是當(dāng)前人工智能應(yīng)用中最受關(guān)注的領(lǐng)域之一。此次的GTC大會,英偉達(dá)發(fā)布了全球首個開源且完全可定制的人形機(jī)器人基礎(chǔ)模型Isaac GR00T N1,并推出加速機(jī)器人開發(fā)的仿真框架。其中,英偉達(dá)、谷歌DeepMind和迪士尼合作開發(fā)新一代開源物理引擎Newton,旨在加速人形機(jī)器人學(xué)習(xí)與開發(fā)。
“物理AI和機(jī)器人正在飛速發(fā)展,可能會成為規(guī)模最大的產(chǎn)業(yè)?!秉S仁勛表示,一切的核心挑戰(zhàn)跟之前類似:數(shù)據(jù)從哪來、模型架構(gòu)是什么、以及如何做擴(kuò)展(scaling)。在機(jī)器人領(lǐng)域,同樣需要能大量生成或獲取數(shù)據(jù),需要強(qiáng)大的算力來訓(xùn)練模型,以及讓AI越訓(xùn)越強(qiáng)的擴(kuò)展性。
作者丨楊鵬岳編輯丨張心怡美編丨馬利亞監(jiān)制丨連曉東