• 正文
    • 01、1530億晶體管!MI300對標H100
    • 02、大火的AI模型怎么不見AMD?
    • 03、GPU緊缺會緩解嗎?會沖擊英偉達的市場?
    • 04、總結(jié)
  • 推薦器件
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

叫板英偉達,AMD真的YES?

2023/06/15
1934
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者|Jimmy&淺土&大藍

當?shù)貢r間6月13日,CPU和GPU領域的“千年老二”AMD舉行了新品發(fā)布會,推出最新強悍GPU,叫板GPU老大英偉達。

沉寂已久的服務器領域近乎開了場春晚,之所以這么引人關注,還是因為今年大火的ChatGPT人工智能再度推上風口浪尖,英偉達GPU變成AI玩家們爭奪算力的搶手金磚,A100價格從去年12月一路上漲,5個月價格累計漲幅達到37.5%,同期其閹割版的A800價格累計漲幅達20.0%。

最大贏家英偉達前不久股價破萬億美元,而在這場發(fā)布會的前幾天,AMD股價漲近10%,給AMD追趕英偉達多了幾分氣氛的烘托。

作為人工智能領域的王者,英偉達站在巔峰多時。這次AMD專為生成式AI 打造的GPU會對原有市場造成影響嗎?AI大火的時候,為什么很少見到AMD的身影?

01、1530億晶體管!MI300對標H100

此次發(fā)布會上,AMD帶來了Instinct MI300系列的產(chǎn)品更多細節(jié)和更新、第四代的Epyc產(chǎn)品的更新,以及預告了之后將推出全新DPU芯片。不過,最矚目的還是當屬用于訓練大模型的最先進GPU Instinct MI300。

近期,AI熱度不減,英偉達憑借最新的超算以及以H100為首的高性能GPU,成功奪下AI王冠。排名第二的AMD的CEO蘇姿豐此前就曾放話表示,要從英偉達手中奪下AI王冠,此次所推出的MI300正是AMD搶奪AI市場的首輪攻勢。

MI300系列是AMD為AI和高性能計算(HPC)打造的一系列最新APU加速卡,此次發(fā)布了該系列兩款新芯片,MI300A是全球首款面向AI和HPC的APU,在設計上同時集成了CPU和GPU;MI300X是純GPU版本,采用了8 個 GPU chiplet(基于CDNA 3架構(gòu))和另外 4 個 IO 內(nèi)存chiplet的設計。簡單來說,MI300A是“基礎款”,MI300X則是硬件性能更高的“大模型優(yōu)化款”。

MI300X是一款專門面向生成式AI推出的加速器,對標英偉達H100。這款加速器全部采用GPU,集成的晶體管數(shù)量達到了驚人的1530億!并且,為了緩解AI大型語言模型?(LLM)?所面臨的內(nèi)存制約,AMD為這款芯片集成了192GB的HBM3,其存儲帶寬也高達5.2TB/s,可以處理的參數(shù)高達400億。

和H100相比,MI300X的高帶寬內(nèi)存(HBM)密度,最高可達英偉達H100的2.4倍,高帶寬內(nèi)存帶寬最高可達H100的1.6倍。也就是說,MI300X能運行比H100更大的AI模型。

蘇姿豐現(xiàn)場展示了MI300X運行包括GPT-3、PaLM2等大模型的優(yōu)勢,并在單個MI300X?GPU上運行擁有400億個參數(shù)的Falcon-40B大型語言模型,讓它寫了一首關于舊金山的詩。這是全球首次在單個GPU上運行這么大的模型。大模型所需要的GPU越少,開發(fā)者的成本也越小。

另一款MI300A,號稱全球首款針對AI和高性能計算(HPC)的加速處理器(APU)加速器,在13個小芯片中遍布1460億個晶體管。它采用CDNA 3 GPU架構(gòu)和24個Zen 4 CPU內(nèi)核,配置128GB的HBM3內(nèi)存。相比前代MI250,MI300的性能提高八倍,效率提高五倍。外媒seminalysis表示,“這是迄今為止市場上最好的HPC芯片,并將保持一段時間?!?/p>

AMD還發(fā)布了AMD Instinct 平臺,它擁有八個MI300X,采用行業(yè)標準OCP設計,提供總計1.5TB的HBM3內(nèi)存。

蘇姿豐表示,MI300A已經(jīng)出樣,MI300X和八個GPU的Instinct 平臺將在今年第三季度出樣,第四季度正式推出。

02、大火的AI模型怎么不見AMD?

雖然AMD看起來并不像是慢半拍的樣子,這幾年動作也頻頻。去年推出了專為數(shù)據(jù)中心設計的MI200系列GPU,還拿下了Meta數(shù)據(jù)中心的訂單。但今年ChatGPT大火后,被人熱議的始終只有英偉達,連帶著與英偉達GPU相關的服務器都在漲價,而英偉達也緊急向臺積電追加訂單,似乎它們也并未料到,這一波熱度是如此來勢洶洶。

所以AMD的存在感呢?

如果只從硬件方面看,AMD并沒有比英偉達差多少,各種紙面參數(shù)對比,AMD也沒有落下風。但從人工智能應用上看,或者說現(xiàn)在流行的大模型,硬件就只是基礎。

我們常說人工智能的三要素:算力、算法、數(shù)據(jù),芯片是算力的來源,算力的強與弱決定了你要耗費多少時間,或者你要耗費多少疊加算力的成本來完成訓練模型,但很多時候軟件層面的優(yōu)化,會使效果事半功倍。

這就好比你玩游戲一樣,硬件再好,優(yōu)化很差,照樣卡成PPT。

所以為了方便開發(fā)人員編程,英偉達和AMD都有自己的加速平臺(CUDA和ROCm),而以此打造的生態(tài),是它們之間差異的所在,也是這場大模型初期的博弈中,英偉達占據(jù)上風的關鍵。

CUDA是英偉達的一種通用并行計算平臺和編程模型,它通過利用GPU的處理能力,可大幅提升計算性能。CUDA使英偉達的GPU能夠執(zhí)行使用C、C++、Fortran、OpenCL、DirectCompute和其他語言編寫的程序。

在CUDA問世之前,對GPU編程必須要編寫大量的底層語言代碼,而CUDA可以讓普通程序員可以利用C語言、C++等為CUDA架構(gòu)編寫程序在GPU平臺上進行大規(guī)模并行計算,在全球GPGPU開發(fā)市場占比已超過80%。GPGPU與CUDA組成的軟硬件底座,構(gòu)成了英偉達引領AI計算及數(shù)據(jù)中心領域的根基。

AMD的ROCm是基于開源項目編寫,其生態(tài)采取HIP編程模型,但HIP與 CUDA的編程語法極為相似,開發(fā)者可以模仿CUDA的編程方式為AMD的GPU產(chǎn)品編程,從而在源代碼層面上兼容CUDA。所以從本質(zhì)上來看,ROCm 生態(tài)只是借用了CUDA的技術,無法真正替代CUDA產(chǎn)生壁壘。

與ROCm的開源基礎不同,CUDA的誕生就只是為了英偉達自家GPU服務,甚至它走在H100、A100等明星產(chǎn)品前,早在2007年英偉達就推出了CUDA,發(fā)展至今已經(jīng)相當成熟,深受開發(fā)者的喜愛,目前主流的深度學習框架都使用CUDA,也就是說現(xiàn)在的AI大模型幾乎都無法避開CUDA,所以訓練大模型自然而然首先想到的是英偉達,而英偉達也基于此打了一套自家產(chǎn)品的組合拳,屬于軟件帶領硬件發(fā)家致富。

但AMD沒有機會了嗎?并不是。

基于CDNA架構(gòu)的AMD GPU是可以跑GPT大模型的,在這次發(fā)布會上,蘇姿豐也展示了MI300系列跑GPT等大模型的效果,紙面參數(shù)也要高于H100。更重要的是,AMD在會上宣布了與Hugging Face建立合作關系。

Hugging Face是人工智能獨角獸企業(yè),在機器學習領域的開發(fā)者肯定不陌生。自從一家NLP公司轉(zhuǎn)型成為一家即用型機器學習模型平臺后,Hugging Face已經(jīng)托管了10萬個預訓練模型和1萬個數(shù)據(jù)集,有超1萬家企業(yè)正在使用該平臺構(gòu)建機器學習技術。

AMD與它的合作無疑是在補齊生態(tài)上的短板,這也是AMD最難跨越英偉達的一道坎,畢竟英偉達已經(jīng)苦心經(jīng)營很久,AMD明顯算是后來者,苦于沒有應用案例,未來或許會有專門針對ROCm的大模型出現(xiàn),只能說AMD終于在機器學習領域亮了劍。

03、GPU緊缺會緩解嗎?會沖擊英偉達的市場?

從長遠來看,AMD會有一席之地,一方面整個通用GPU市場,除了英偉達就是AMD了,而機器學習只是個開始,未來人工智能和服務器及超算市場足夠龐大,AMD有能力去爭奪。另一方面,整個GPU及服務器市場已經(jīng)出現(xiàn)供不應求的場面了,而下游應用企業(yè)不會坐以待斃,站在風口上,誰速度快,誰才有市場。

5月英偉達GPU的交期再次拉長,基本需要三個月或更長,部分新訂單“可能要到12月才能交付”,就連特供中國的A800(A100閹割版)都在市場上被炒到10萬一塊,國內(nèi)字節(jié)跳動等互聯(lián)網(wǎng)大廠紛紛找英偉達下大單,爭奪AI入場券。

在英偉達供應緊缺的情況下,自然會有人想用其他方式來實現(xiàn),這不,微軟已經(jīng)找上AMD來合作開發(fā)人工智能芯片,目的就是為了尋找另一條路徑,縱觀整個通用GPU市場,大概只有AMD還有這樣的潛力。

但短期來看,AMD不太會緩解現(xiàn)在GPU供應緊張的狀態(tài)。

首先,MI300系列正式推出要等到下半年,甚至到第四季度,各種基準測試的結(jié)果都還沒披露,實際性能到底如何還不知道。

其次,AMD使用的也是臺積電的CoWoS先進封裝。目前臺積電的產(chǎn)能已經(jīng)告急,英偉達和AMD合計占據(jù)了7-8成的產(chǎn)能,臺積電預計到2024年底擴產(chǎn)到每月20000片產(chǎn)能,但光英偉達就要消耗預計一半的產(chǎn)能,AMD也在嘗試為明年預訂額外的產(chǎn)能,所以同樣都面臨著產(chǎn)能問題。

最后,訓練一個大模型要耗費大量的時間和成本,業(yè)內(nèi)分析,MI300的封裝技術相當復雜,成本不見得比英偉達有優(yōu)勢,況且現(xiàn)在臺積電產(chǎn)能緊缺,AMD供貨能力有多少也并不清楚。要推出一個基于AMD架構(gòu)的模型,并以此打開新的市場,需要一定的時間,還得有人愿意為ROCm生態(tài)貢獻自己一份力。

發(fā)布會上,AMD并沒有透露誰計劃使用這些芯片,發(fā)布會結(jié)束后,AMD的股價不漲反跌,也反映了市場對AMD的情緒。

04、總結(jié)

目前英偉達擁有超過80%的市場份額,占據(jù)人工智能芯片市場的主導地位。國外主流媒體與分析師似乎不太看好AMD這次與英偉達的較量,他們認為,AMD不透露售價,也不透露客戶,或許會讓華爾街失望,雖然對于微軟、亞馬遜等急著用芯片的企業(yè),AMD是不二的選擇,但這并不意味著能搶走英偉達多少市場份額,

蘇姿豐可能會回想起加入AMD后受到顧問質(zhì)疑的時刻,就像此刻她面對整個華爾街質(zhì)疑的時候一樣。后來蘇姿豐帶領AMD走出低谷,從瀕死到涅槃,她創(chuàng)造了一個神話。

在近期的福布斯采訪中,蘇姿豐說道:“如果你展望未來五年,你會看到AMD的每款產(chǎn)品都有AI的影子,它將成為最大的增長驅(qū)動因素?!?/p>

重生過后的AMD要翻越另一座大山,蘇姿豐能再一次創(chuàng)造神話嗎?

 

 

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
ATMEGA64-16AU 1 Microchip Technology Inc IC MCU 8BIT 64KB FLASH 64TQFP

ECAD模型

下載ECAD模型
$19.46 查看
ATXMEGA128A3U-AUR 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 64TQFP
$5.3 查看
MCF52259CVN80 1 NXP Semiconductors 32-BIT, FLASH, 80MHz, RISC MICROCONTROLLER, BGA144
$48.73 查看
AMD

AMD

AMD公司成立于1969年,總部位于美國加利福尼亞州桑尼維爾。AMD(NYSE: AMD)是一家創(chuàng)新的科技公司,致力于與客戶及合作伙伴緊密合作,開發(fā)下一代面向商用、家用和游戲領域的計算和圖形處理解決方案。

AMD公司成立于1969年,總部位于美國加利福尼亞州桑尼維爾。AMD(NYSE: AMD)是一家創(chuàng)新的科技公司,致力于與客戶及合作伙伴緊密合作,開發(fā)下一代面向商用、家用和游戲領域的計算和圖形處理解決方案。收起

查看更多

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄