久久免费少妇一级a片,97免费人妻视在线视频首页

作者|Jimmy&淺土&大藍

當?shù)貢r間6月13日，CPU和GPU領域的“千年老二”AMD舉行了新品發(fā)布會，推出最新強悍GPU，叫板GPU老大英偉達。

沉寂已久的服務器領域近乎開了場春晚，之所以這么引人關注，還是因為今年大火的ChatGPT將人工智能再度推上風口浪尖，英偉達GPU變成AI玩家們爭奪算力的搶手金磚，A100價格從去年12月一路上漲，5個月價格累計漲幅達到37.5%，同期其閹割版的A800價格累計漲幅達20.0%。

最大贏家英偉達前不久股價破萬億美元，而在這場發(fā)布會的前幾天，AMD股價漲近10%，給AMD追趕英偉達多了幾分氣氛的烘托。

作為人工智能領域的王者，英偉達站在巔峰多時。這次AMD專為生成式AI 打造的GPU會對原有市場造成影響嗎？AI大火的時候，為什么很少見到AMD的身影？

01、1530億晶體管！MI300對標H100

此次發(fā)布會上，AMD帶來了Instinct MI300系列的產(chǎn)品更多細節(jié)和更新、第四代的Epyc產(chǎn)品的更新，以及預告了之后將推出全新DPU芯片。不過，最矚目的還是當屬用于訓練大模型的最先進GPU Instinct MI300。

近期，AI熱度不減，英偉達憑借最新的超算以及以H100為首的高性能GPU，成功奪下AI王冠。排名第二的AMD的CEO蘇姿豐此前就曾放話表示，要從英偉達手中奪下AI王冠，此次所推出的MI300正是AMD搶奪AI市場的首輪攻勢。

MI300系列是AMD為AI和高性能計算（HPC）打造的一系列最新APU加速卡，此次發(fā)布了該系列兩款新芯片，MI300A是全球首款面向AI和HPC的APU，在設計上同時集成了CPU和GPU；MI300X是純GPU版本，采用了8 個 GPU chiplet（基于CDNA 3架構(gòu)）和另外 4 個 IO 內(nèi)存chiplet的設計。簡單來說，MI300A是“基礎款”，MI300X則是硬件性能更高的“大模型優(yōu)化款”。

MI300X是一款專門面向生成式AI推出的加速器，對標英偉達H100。這款加速器全部采用GPU，集成的晶體管數(shù)量達到了驚人的1530億！并且，為了緩解AI大型語言模型?(LLM)?所面臨的內(nèi)存制約，AMD為這款芯片集成了192GB的HBM3，其存儲帶寬也高達5.2TB/s，可以處理的參數(shù)高達400億。

和H100相比，MI300X的高帶寬內(nèi)存（HBM）密度，最高可達英偉達H100的2.4倍，高帶寬內(nèi)存帶寬最高可達H100的1.6倍。也就是說，MI300X能運行比H100更大的AI模型。

蘇姿豐現(xiàn)場展示了MI300X運行包括GPT-3、PaLM2等大模型的優(yōu)勢，并在單個MI300X?GPU上運行擁有400億個參數(shù)的Falcon-40B大型語言模型，讓它寫了一首關于舊金山的詩。這是全球首次在單個GPU上運行這么大的模型。大模型所需要的GPU越少，開發(fā)者的成本也越小。

另一款MI300A，號稱全球首款針對AI和高性能計算（HPC）的加速處理器（APU）加速器，在13個小芯片中遍布1460億個晶體管。它采用CDNA 3 GPU架構(gòu)和24個Zen 4 CPU內(nèi)核，配置128GB的HBM3內(nèi)存。相比前代MI250，MI300的性能提高八倍，效率提高五倍。外媒seminalysis表示，“這是迄今為止市場上最好的HPC芯片，并將保持一段時間?！?/p>

AMD還發(fā)布了AMD Instinct 平臺，它擁有八個MI300X，采用行業(yè)標準OCP設計，提供總計1.5TB的HBM3內(nèi)存。

蘇姿豐表示，MI300A已經(jīng)出樣，MI300X和八個GPU的Instinct 平臺將在今年第三季度出樣，第四季度正式推出。

02、大火的AI模型怎么不見AMD？

雖然AMD看起來并不像是慢半拍的樣子，這幾年動作也頻頻。去年推出了專為數(shù)據(jù)中心設計的MI200系列GPU，還拿下了Meta數(shù)據(jù)中心的訂單。但今年ChatGPT大火后，被人熱議的始終只有英偉達，連帶著與英偉達GPU相關的服務器都在漲價，而英偉達也緊急向臺積電追加訂單，似乎它們也并未料到，這一波熱度是如此來勢洶洶。

所以AMD的存在感呢？

如果只從硬件方面看，AMD并沒有比英偉達差多少，各種紙面參數(shù)對比，AMD也沒有落下風。但從人工智能應用上看，或者說現(xiàn)在流行的大模型，硬件就只是基礎。

我們常說人工智能的三要素：算力、算法、數(shù)據(jù)，芯片是算力的來源，算力的強與弱決定了你要耗費多少時間，或者你要耗費多少疊加算力的成本來完成訓練模型，但很多時候軟件層面的優(yōu)化，會使效果事半功倍。

這就好比你玩游戲一樣，硬件再好，優(yōu)化很差，照樣卡成PPT。

所以為了方便開發(fā)人員編程，英偉達和AMD都有自己的加速平臺（CUDA和ROCm），而以此打造的生態(tài)，是它們之間差異的所在，也是這場大模型初期的博弈中，英偉達占據(jù)上風的關鍵。

CUDA是英偉達的一種通用并行計算平臺和編程模型，它通過利用GPU的處理能力，可大幅提升計算性能。CUDA使英偉達的GPU能夠執(zhí)行使用C、C++、Fortran、OpenCL、DirectCompute和其他語言編寫的程序。

在CUDA問世之前，對GPU編程必須要編寫大量的底層語言代碼，而CUDA可以讓普通程序員可以利用C語言、C++等為CUDA架構(gòu)編寫程序在GPU平臺上進行大規(guī)模并行計算，在全球GPGPU開發(fā)市場占比已超過80%。GPGPU與CUDA組成的軟硬件底座，構(gòu)成了英偉達引領AI計算及數(shù)據(jù)中心領域的根基。

AMD的ROCm是基于開源項目編寫，其生態(tài)采取HIP編程模型，但HIP與 CUDA的編程語法極為相似，開發(fā)者可以模仿CUDA的編程方式為AMD的GPU產(chǎn)品編程，從而在源代碼層面上兼容CUDA。所以從本質(zhì)上來看，ROCm 生態(tài)只是借用了CUDA的技術，無法真正替代CUDA產(chǎn)生壁壘。

與ROCm的開源基礎不同，CUDA的誕生就只是為了英偉達自家GPU服務，甚至它走在H100、A100等明星產(chǎn)品前，早在2007年英偉達就推出了CUDA，發(fā)展至今已經(jīng)相當成熟，深受開發(fā)者的喜愛，目前主流的深度學習框架都使用CUDA，也就是說現(xiàn)在的AI大模型幾乎都無法避開CUDA，所以訓練大模型自然而然首先想到的是英偉達，而英偉達也基于此打了一套自家產(chǎn)品的組合拳，屬于軟件帶領硬件發(fā)家致富。

但AMD沒有機會了嗎？并不是。

基于CDNA架構(gòu)的AMD GPU是可以跑GPT大模型的，在這次發(fā)布會上，蘇姿豐也展示了MI300系列跑GPT等大模型的效果，紙面參數(shù)也要高于H100。更重要的是，AMD在會上宣布了與Hugging Face建立合作關系。

Hugging Face是人工智能獨角獸企業(yè)，在機器學習領域的開發(fā)者肯定不陌生。自從一家NLP公司轉(zhuǎn)型成為一家即用型機器學習模型平臺后，Hugging Face已經(jīng)托管了10萬個預訓練模型和1萬個數(shù)據(jù)集，有超1萬家企業(yè)正在使用該平臺構(gòu)建機器學習技術。

AMD與它的合作無疑是在補齊生態(tài)上的短板，這也是AMD最難跨越英偉達的一道坎，畢竟英偉達已經(jīng)苦心經(jīng)營很久，AMD明顯算是后來者，苦于沒有應用案例，未來或許會有專門針對ROCm的大模型出現(xiàn)，只能說AMD終于在機器學習領域亮了劍。

03、GPU緊缺會緩解嗎？會沖擊英偉達的市場？

從長遠來看，AMD會有一席之地，一方面整個通用GPU市場，除了英偉達就是AMD了，而機器學習只是個開始，未來人工智能和服務器及超算市場足夠龐大，AMD有能力去爭奪。另一方面，整個GPU及服務器市場已經(jīng)出現(xiàn)供不應求的場面了，而下游應用企業(yè)不會坐以待斃，站在風口上，誰速度快，誰才有市場。

5月英偉達GPU的交期再次拉長，基本需要三個月或更長，部分新訂單“可能要到12月才能交付”，就連特供中國的A800（A100閹割版）都在市場上被炒到10萬一塊，國內(nèi)字節(jié)跳動等互聯(lián)網(wǎng)大廠紛紛找英偉達下大單，爭奪AI入場券。

在英偉達供應緊缺的情況下，自然會有人想用其他方式來實現(xiàn)，這不，微軟已經(jīng)找上AMD來合作開發(fā)人工智能芯片，目的就是為了尋找另一條路徑，縱觀整個通用GPU市場，大概只有AMD還有這樣的潛力。

但短期來看，AMD不太會緩解現(xiàn)在GPU供應緊張的狀態(tài)。

首先，MI300系列正式推出要等到下半年，甚至到第四季度，各種基準測試的結(jié)果都還沒披露，實際性能到底如何還不知道。

其次，AMD使用的也是臺積電的CoWoS先進封裝。目前臺積電的產(chǎn)能已經(jīng)告急，英偉達和AMD合計占據(jù)了7-8成的產(chǎn)能，臺積電預計到2024年底擴產(chǎn)到每月20000片產(chǎn)能，但光英偉達就要消耗預計一半的產(chǎn)能，AMD也在嘗試為明年預訂額外的產(chǎn)能，所以同樣都面臨著產(chǎn)能問題。

最后，訓練一個大模型要耗費大量的時間和成本，業(yè)內(nèi)分析，MI300的封裝技術相當復雜，成本不見得比英偉達有優(yōu)勢，況且現(xiàn)在臺積電產(chǎn)能緊缺，AMD供貨能力有多少也并不清楚。要推出一個基于AMD架構(gòu)的模型，并以此打開新的市場，需要一定的時間，還得有人愿意為ROCm生態(tài)貢獻自己一份力。

發(fā)布會上，AMD并沒有透露誰計劃使用這些芯片，發(fā)布會結(jié)束后，AMD的股價不漲反跌，也反映了市場對AMD的情緒。

04、總結(jié)

目前英偉達擁有超過80%的市場份額，占據(jù)人工智能芯片市場的主導地位。國外主流媒體與分析師似乎不太看好AMD這次與英偉達的較量，他們認為，AMD不透露售價，也不透露客戶，或許會讓華爾街失望，雖然對于微軟、亞馬遜等急著用芯片的企業(yè)，AMD是不二的選擇，但這并不意味著能搶走英偉達多少市場份額，

蘇姿豐可能會回想起加入AMD后受到顧問質(zhì)疑的時刻，就像此刻她面對整個華爾街質(zhì)疑的時候一樣。后來蘇姿豐帶領AMD走出低谷，從瀕死到涅槃，她創(chuàng)造了一個神話。

在近期的福布斯采訪中，蘇姿豐說道：“如果你展望未來五年，你會看到AMD的每款產(chǎn)品都有AI的影子，它將成為最大的增長驅(qū)動因素?！?/p>

重生過后的AMD要翻越另一座大山，蘇姿豐能再一次創(chuàng)造神話嗎？

器件型號	數(shù)量	器件廠商	器件描述	ECAD模型	參考價格	更多信息
ATMEGA64-16AU	1	Microchip Technology Inc	IC MCU 8BIT 64KB FLASH 64TQFP	ECAD模型下載ECAD模型	$19.46	查看
ATXMEGA128A3U-AUR	1	Microchip Technology Inc	IC MCU 8BIT 128KB FLASH 64TQFP		$5.3	查看
MCF52259CVN80	1	NXP Semiconductors	32-BIT, FLASH, 80MHz, RISC MICROCONTROLLER, BGA144		$48.73	查看

器件型號

數(shù)量

器件廠商

器件描述

數(shù)據(jù)手冊

ECAD模型

風險等級

參考價格

更多信息

ATMEGA64-16AU

Microchip Technology Inc

IC MCU 8BIT 64KB FLASH 64TQFP