作者丨包永剛編輯丨王亞峰
美股的下跌,讓英偉達(dá)已經(jīng)跌出3萬(wàn)億美元俱樂(lè)部,華爾街需要一個(gè)令人振奮的消息。
本周舉行的NVIDIA GTC 2025年度大會(huì)上,英偉達(dá)CEO黃仁勛公布了未來(lái)三年的產(chǎn)品路線(xiàn)圖。未來(lái)三年,將每年推出一代產(chǎn)品,這一堪稱(chēng)激進(jìn)的路線(xiàn)圖,加上算力需求100倍增長(zhǎng)的數(shù)據(jù),也沒(méi)能刺激投資者,當(dāng)日英偉達(dá)股價(jià)下跌超3%。
“英偉達(dá)幾乎是貼著技術(shù)的極限給出的產(chǎn)品路線(xiàn)圖,我認(rèn)為是希望給投資人和合作伙伴一個(gè)確定性?!鄙虾D沃悄軇?chuàng)始人徐凌杰認(rèn)為,“但因?yàn)闃I(yè)界早有預(yù)期,沒(méi)能起到提振股價(jià)的作用?!辟Y深投資人博文說(shuō),“英偉達(dá)2025年業(yè)績(jī)?cè)鲩L(zhǎng)比較明確,但明年的業(yè)績(jī)尚不明朗,資本市場(chǎng)已提前反映了這種不確定性?!?/p>
DeepSeek到底給英偉達(dá)帶來(lái)了怎樣的不確定性?英偉達(dá)要從一家AI計(jì)算公司轉(zhuǎn)變?yōu)橐患褹I基礎(chǔ)設(shè)施公司,面臨著怎樣的挑戰(zhàn)?歡迎添加作者微信BENSONEIT討論。
01、英偉達(dá)開(kāi)始擠牙膏?
“最新的產(chǎn)品路線(xiàn)圖,英偉達(dá)兩年更新一代架構(gòu)的節(jié)奏保持不變,變的是以前一代架構(gòu)一代產(chǎn)品,現(xiàn)在變成了一代架構(gòu)兩代產(chǎn)品?!盇I行業(yè)資深人士浩民說(shuō),“但同一代架構(gòu)的兩代產(chǎn)品性能提升并不大,英偉達(dá)在擠牙膏?!?/p>
徐凌杰的觀(guān)點(diǎn)截然相反,“英偉達(dá)不僅沒(méi)有擠牙膏,反而比較激進(jìn)。因?yàn)榧夹g(shù)有極限,從架構(gòu)到制程,再到封裝和HBM,英偉達(dá)都在往極致的方向走。”“大家期待英偉達(dá)持續(xù)的跨越式創(chuàng)新,但現(xiàn)實(shí)是產(chǎn)品從60分提升到80分容易,但要從90分做到95分很難。”徐凌杰表示,“認(rèn)為英偉達(dá)擠牙膏的,是高預(yù)期和現(xiàn)實(shí)之間的差距。”雖然貼著技術(shù)上限的產(chǎn)品路線(xiàn)圖沒(méi)能起到提振股價(jià)的作用,但未來(lái)三年明確的技術(shù)路線(xiàn)圖能給產(chǎn)業(yè)合作伙伴信心。、
英偉達(dá)GB200在過(guò)去一年中經(jīng)歷了多次量產(chǎn)和交付的延期,暴露出了更復(fù)雜的計(jì)算系統(tǒng)在制造和部署過(guò)程中面臨的良率、互聯(lián)、供電、散熱等一系列問(wèn)題。“英偉達(dá)最新的路線(xiàn)圖能夠給業(yè)界一個(gè)確定性,表達(dá)英偉達(dá)一定會(huì)堅(jiān)持先做好縱向擴(kuò)展(Scale Up),然后做橫向擴(kuò)展(Scale Out),即便面臨問(wèn)題,也會(huì)堅(jiān)持這條路線(xiàn)。”徐凌杰認(rèn)為,“英偉達(dá)希望合作伙伴能夠與其繼續(xù)共同推進(jìn)?!?/p>
一年更新一代產(chǎn)品的路線(xiàn)圖也包含了黃仁勛的危機(jī)感。“這樣的產(chǎn)品迭代速度,我認(rèn)為是黃仁勛不希望給對(duì)手任何超越的縫隙?!焙泼襁@樣認(rèn)為。特別是在2024年AMD收購(gòu)超大規(guī)模計(jì)算解決方案供應(yīng)商ZT Systems之后,英偉達(dá)更應(yīng)該關(guān)注競(jìng)爭(zhēng)對(duì)手。貼著技術(shù)極限的更新產(chǎn)品有利于英偉達(dá)保持領(lǐng)先地位,但風(fēng)險(xiǎn)也顯而易見(jiàn)。多家芯片巨頭也都有過(guò)因?yàn)槭褂米钚轮瞥處?lái)產(chǎn)品發(fā)熱問(wèn)題的經(jīng)歷,英偉達(dá)2009年就曾因?yàn)槭褂卯?dāng)時(shí)臺(tái)積電最先進(jìn)的40nm制程遭遇了GPU顯卡功耗和散熱的問(wèn)題。GB200遇到的問(wèn)題也已經(jīng)展現(xiàn)了英偉達(dá)走在技術(shù)最前沿可能遇到的各種挑戰(zhàn),如今產(chǎn)品的更新節(jié)奏進(jìn)一步加快,對(duì)英偉達(dá)來(lái)說(shuō)有許多難以預(yù)料的技術(shù)和工程挑戰(zhàn)。為了應(yīng)對(duì)挑戰(zhàn),英偉達(dá)進(jìn)行了一個(gè)重要的改變,這在黃仁勛GTC的演講中并未提及。
英偉達(dá)將改變GPU芯片焊接固定在主板上的方式,改為插槽式設(shè)計(jì)(Socket),這一改變讓GPU是通過(guò)插拔的方式與主板連接,將大幅降低英偉達(dá)維修主板的成本和難度?!安宀凼皆O(shè)計(jì)將提升GPU/CPU生產(chǎn)效率和PCB設(shè)計(jì)的靈活性?!眲P力迪科技總經(jīng)理?xiàng)铒w對(duì)雷峰網(wǎng)表示,“預(yù)計(jì)2025年第三季度就會(huì)有英偉達(dá)最新發(fā)布的Blackwell Ultra GPU采用插槽式設(shè)計(jì)的方案,國(guó)內(nèi)公司跟進(jìn)這一方案最快要到明年?!庇ミ_(dá)一個(gè)小的改變將帶來(lái)產(chǎn)業(yè)鏈的更多變化,添加作者微信BENSONEIT進(jìn)一步交流。除了更加復(fù)雜的AI系統(tǒng)部署面臨的挑戰(zhàn),AI業(yè)界關(guān)注的重點(diǎn)從訓(xùn)練轉(zhuǎn)向推理才是英偉達(dá)面臨的更大的不確定性。
02、AI推理時(shí)代,英偉達(dá)的領(lǐng)導(dǎo)地位可能改變
英偉達(dá)在AI訓(xùn)練市場(chǎng)的地位目前看起來(lái)無(wú)可撼動(dòng),并且英偉達(dá)還在加深其護(hù)城河。“在競(jìng)爭(zhēng)對(duì)手只能將8張GPU卡互聯(lián)的時(shí)候,英偉達(dá)的NVLink就已經(jīng)可以實(shí)現(xiàn)72張GPU卡互聯(lián),如今NV Link的能力進(jìn)一步提升,正朝著144個(gè)GPU卡、576個(gè)GPU卡的方向發(fā)展?!焙泼裾f(shuō),“AI訓(xùn)練需要足夠的通用性,英偉達(dá)的CUDA和GPU是最好選擇?!?/strong>黃仁勛不僅從技術(shù)上讓英偉達(dá)GPU成為了AI訓(xùn)練的最好選擇,也在商業(yè)上讓英偉達(dá)實(shí)現(xiàn)了營(yíng)收的跨越式增長(zhǎng)。
英偉達(dá)V100 GPU時(shí)還出售芯片模塊,到A100時(shí)就只賣(mài)包含背板的套卡,再到讓北美客戶(hù)買(mǎi)單包含整套英偉達(dá)DGX系統(tǒng),英偉達(dá)在AI服務(wù)器組件中的占比越來(lái)越高,英偉達(dá)實(shí)現(xiàn)了營(yíng)收和利潤(rùn)的雙豐收。面對(duì)DeepSeek帶來(lái)的沖擊,黃仁勛先是在演講中做出回答:“全世界都錯(cuò)了,Scaling law有更強(qiáng)的韌性,現(xiàn)在的計(jì)算量是去年同期的100倍?!?/strong>
然后黃仁勛大秀成績(jī)單,他表示,2024年美國(guó)前四云廠(chǎng)總計(jì)采購(gòu)130萬(wàn)顆Hopper架構(gòu)芯片,2025年這一數(shù)據(jù)飆升至360萬(wàn)顆Blackwell GPU?!?strong>2023年到2025年是英偉達(dá)的超級(jí)增長(zhǎng)周期,即便是在半導(dǎo)體行業(yè)我認(rèn)為也是史無(wú)前例?!毙酒瑥臉I(yè)者俊杰說(shuō),“2024年全年英偉達(dá)營(yíng)收高達(dá)1305億美元,相比2023年增長(zhǎng)114%,但2025年翻倍的業(yè)績(jī)已經(jīng)難以維持,25%的業(yè)績(jī)?cè)鲩L(zhǎng)屬于預(yù)期,超過(guò)25%就屬于超預(yù)期。”英偉達(dá)營(yíng)收增長(zhǎng)的動(dòng)力,一個(gè)可以參考的指標(biāo)是各大互聯(lián)網(wǎng)公司的資本支出,特別是美國(guó)幾大云服務(wù)提供商(CSP)。
如今美國(guó)的科技巨頭們實(shí)現(xiàn)了一個(gè)相互支持的正向循環(huán),微軟投資OpenAI,OpenAI使用微軟的云服務(wù),微軟再購(gòu)買(mǎi)英偉達(dá)的AI芯片和系統(tǒng),美國(guó)科技巨頭們相互支持,提升股價(jià)的正向循環(huán),然而這個(gè)循環(huán)正在DeepSeek打破。“DeepSeek展現(xiàn)了高性?xún)r(jià)比支持大模型的方式,這會(huì)業(yè)界對(duì)AI模型預(yù)訓(xùn)練的想法會(huì)發(fā)生改變,一些互聯(lián)網(wǎng)巨頭可能會(huì)支持自家的芯片項(xiàng)目,調(diào)低資本支出。”徐凌杰說(shuō),“科技巨頭不會(huì)馬上調(diào)低資本支出,但即便英偉達(dá)的業(yè)績(jī)保持增長(zhǎng),原來(lái)覺(jué)得英偉達(dá)的40倍的市盈率(PE)沒(méi)問(wèn)題,現(xiàn)在可能20倍PE都嫌貴。”“做預(yù)訓(xùn)練肯定首選英偉達(dá),但AI推理英偉達(dá)就沒(méi)有如此明顯的優(yōu)勢(shì)。”浩民說(shuō),“如果全球范圍內(nèi)AI的模型收斂到10個(gè)左右,只是適配這些確定的模型,無(wú)論什么架構(gòu)的芯片都可以適配的很好。”
“如果算法確定,DAS芯片做AI推理會(huì)比GPU性能更強(qiáng)?!?/strong>俊杰也認(rèn)為。博文說(shuō),“AI轉(zhuǎn)向推理和應(yīng)用時(shí)代,利好國(guó)產(chǎn)芯片,因?yàn)閲?guó)內(nèi)是巨大的應(yīng)用市場(chǎng)。”對(duì)于云服務(wù)提供商來(lái)說(shuō),即便自研的芯片性能不及英偉達(dá)成熟的GPU,但計(jì)算投入產(chǎn)出比,仍然有可能實(shí)現(xiàn)比英偉達(dá)更高的推理性?xún)r(jià)比。浩民認(rèn)為,“此時(shí)英偉達(dá)GPU將不是云服務(wù)提供商們的首選?!备鶕?jù)英偉達(dá)2024財(cái)年第四季度財(cái)報(bào)及相關(guān)披露信息,云端推理收入占其數(shù)據(jù)中心業(yè)務(wù)的40%。英偉達(dá)在努力強(qiáng)調(diào)即便在推理時(shí)代,其優(yōu)勢(shì)依舊明顯??〗苷J(rèn)為,如果AI應(yīng)用真的興起,推理業(yè)務(wù)應(yīng)該占到收入的90%。
“客戶(hù)最關(guān)心的推理的性?xún)r(jià)比,如果有競(jìng)爭(zhēng)對(duì)手把推理性能優(yōu)化得很好,或者每Token的價(jià)格很低,其他玩家必須馬上跟進(jìn),否則將會(huì)失去市場(chǎng)份額?!焙泼裾f(shuō),“CSP之間的激烈競(jìng)爭(zhēng)會(huì)讓其選擇最具性?xún)r(jià)比的解決方案?!庇ミ_(dá)清楚自身面臨的挑戰(zhàn),在GTC 2025上推出了分布式推理服務(wù)庫(kù)Dynamo,基于這個(gè)全新的服務(wù)庫(kù),可以實(shí)現(xiàn)新一代Blackwell GPU相比Hopper GPU 40倍的性能提升。
徐凌杰分析認(rèn)為,40倍的性能提升中,2.5倍來(lái)自芯片的代際性能提升,1.8提升來(lái)自數(shù)據(jù)類(lèi)型從FP8變?yōu)镕P4,兩項(xiàng)提升性能提升大約5倍,另外8倍的性能提升來(lái)自NVSwitch高速互連和更大搜索空間的分布式策略。“如此大幅的性能提升,意味著NVL72 GPU的軟硬件優(yōu)化的空間很大?!?/strong>徐凌杰說(shuō),“結(jié)合英偉達(dá)改用Socket,對(duì)于基于英偉達(dá)GPU進(jìn)行優(yōu)化,想要推出差異化的AI推理集群產(chǎn)品和解決方案的公司,是一個(gè)很好的機(jī)會(huì)?!钡荄ynamo的主要客戶(hù)并非互聯(lián)網(wǎng)巨頭。“互聯(lián)網(wǎng)巨頭技術(shù)實(shí)力更強(qiáng),他們更傾向于自己構(gòu)建一套優(yōu)化工具而非直接使用英偉達(dá)的Dynamo?!焙泼裾J(rèn)為,“買(mǎi)單Dynamo的更多會(huì)是企業(yè)客戶(hù)?!?/strong>這將給英偉達(dá)的業(yè)績(jī)?cè)鲩L(zhǎng)帶來(lái)壓力,如果是給大型云服務(wù)提供商銷(xiāo)售DGX,一個(gè)集群的訂單金額高達(dá)數(shù)百萬(wàn)美元,但是企業(yè)級(jí)市場(chǎng)的客戶(hù),一個(gè)訂單的金額可能只有幾十萬(wàn)美金,差距明顯?!?strong>做企業(yè)級(jí)市場(chǎng)雖然營(yíng)收增長(zhǎng)不會(huì)像和CSP做生意那樣營(yíng)收增長(zhǎng)曲線(xiàn)很陡峭,但企業(yè)級(jí)市場(chǎng)增長(zhǎng)慢,下跌也會(huì)很慢,這個(gè)市場(chǎng)相對(duì)比較穩(wěn)定,如果英偉達(dá)拿下這個(gè)市場(chǎng),也會(huì)成為其重要的基本盤(pán)?!焙泼裾J(rèn)為。英偉達(dá)在未來(lái)幾年仍將保持領(lǐng)導(dǎo)地位,但從長(zhǎng)期來(lái)看,隨著競(jìng)爭(zhēng)的加劇,其領(lǐng)導(dǎo)地位可能會(huì)發(fā)生變化。
03、轉(zhuǎn)變?yōu)锳I基礎(chǔ)設(shè)施公司,英偉達(dá)的賭注很大
隨著AI從簡(jiǎn)單推理,轉(zhuǎn)向Reasoning,再到Agent,每個(gè)步驟進(jìn)行推理勢(shì)必讓產(chǎn)生的Token數(shù)量增加,Token將成為AI的基本單元,能夠提高Token的生產(chǎn)速度就是提高生產(chǎn)效率。AI工廠(chǎng)就是英偉達(dá)GTC 2025上被反復(fù)提及的關(guān)鍵,英偉達(dá)也有一個(gè)完整的敘事——從一家AI計(jì)算機(jī)公司轉(zhuǎn)變?yōu)橐患褹I基礎(chǔ)設(shè)施公司。
每年更新的GPU計(jì)算平臺(tái)、Spectrum-X和Quantum-X硅光網(wǎng)絡(luò)交換等構(gòu)建的DGX是AI工廠(chǎng)的硬件,Dynamo是AI 工廠(chǎng)的操作系統(tǒng),AI-Q(NVIDIA IQ Blueprint)AI代理架構(gòu)是提供給客戶(hù)部署AI的工具,從硬件系統(tǒng)到軟件工具,從數(shù)據(jù)到模型,英偉達(dá)更宏大的目標(biāo)是成為AI工廠(chǎng)。“英偉達(dá)的戰(zhàn)略方向很明確,但落地難度很大?!毙炝杞苷J(rèn)為,“要從一個(gè)芯片公司成為一個(gè)基礎(chǔ)設(shè)施公司,這個(gè)門(mén)檻跨過(guò)去,那就是極高的壁壘。這是一個(gè)巨大的賭注,但也讓全世界看到了黃仁勛追求通用人工智能的決心。”其實(shí),很多年前黃仁勛就一直強(qiáng)調(diào)英偉達(dá)不是芯片公司,而是系統(tǒng)公司。只是在生成式AI的時(shí)代,英偉達(dá)系統(tǒng)公司的定位更加明確為AI基礎(chǔ)設(shè)施公司。英偉達(dá)想要成為一個(gè)時(shí)代前進(jìn)的基石,如果成功英偉達(dá)將成為一個(gè)時(shí)代的縮影,但以幾乎接近技術(shù)極限的方式追求成功,失敗的代價(jià)也將難以估量。
英偉達(dá)會(huì)推出GB30嗎?添加作者微信BENSONEIT互通有無(wú)。
注:文中博文、浩民、俊杰均為化名。