AI大模型正在重新定義CPU,它除了具備更高的可靠性、穩(wěn)定性、可擴(kuò)展性,還要具備更強(qiáng)的AI計(jì)算能力,以滿足AI大模型對(duì)計(jì)算資源的需求。同時(shí),能效比越來(lái)越重要,這樣才能保證大模型訓(xùn)練和推理過(guò)程中,能源和成本的合理支出。在這些趨勢(shì)下,CPU逐漸從傳統(tǒng)的通用計(jì)算能力,轉(zhuǎn)變?yōu)楦螦I大模型需求的“多面手”。
IDC表示,隨著AI應(yīng)用的日益普及,預(yù)計(jì)到2027年,各組織在生成式AI(GenAI)方面的支出將高達(dá)1530億美元,而機(jī)器學(xué)習(xí)和分析的總支出將達(dá)到3610億美元。英特爾至強(qiáng)6處理器經(jīng)過(guò)優(yōu)化,有望在這一蓬勃發(fā)展的市場(chǎng)中扮演重要角色,并可作為機(jī)頭節(jié)點(diǎn)CPU,在傳統(tǒng)機(jī)器學(xué)習(xí)、小型生成式AI模型和GPU加速工作負(fù)載中提供出色性能。
英特爾臨時(shí)聯(lián)合首席執(zhí)行官兼英特爾產(chǎn)品首席執(zhí)行官M(fèi)ichelle Johnston Holthaus表示,“英特爾深耕數(shù)據(jù)中心市場(chǎng)數(shù)十余年,并通過(guò)x86 架構(gòu)引領(lǐng)標(biāo)準(zhǔn)制定和行業(yè)發(fā)展。目前,英特爾的處理器正為絕大多數(shù)數(shù)據(jù)中心提供動(dòng)力?!?/p>
為了充分滿足市場(chǎng)多樣需求,英特爾不斷完善至強(qiáng)產(chǎn)品系列,日前推出了至強(qiáng)6性能核處理器6700/6500,實(shí)現(xiàn)了2倍的AI處理性能提升;同時(shí),專為網(wǎng)絡(luò)和邊緣應(yīng)用設(shè)計(jì)的全新至強(qiáng)6 SoC芯片,實(shí)現(xiàn)了2.4倍的無(wú)線接入網(wǎng)(RAN)工作負(fù)載容量提升。
至強(qiáng)6700/6500——提供出色性能與能效平衡
最新的至強(qiáng)6700/6500性能核處理器,在數(shù)據(jù)中心和網(wǎng)絡(luò)產(chǎn)品組合方面均取得了顯著進(jìn)展。與上一代產(chǎn)品相比,至強(qiáng)6處理器在廣泛的企業(yè)工作負(fù)載中實(shí)現(xiàn)了平均1.4倍的性能提升。作為AI系統(tǒng)的機(jī)頭節(jié)點(diǎn)CPU,至強(qiáng)6可與GPU搭配,為客戶提供優(yōu)選組合。
此外,它以更少的核心數(shù)量,提供1.5倍的AI推理性能提升。至強(qiáng)6處理器還具備出色的每瓦性能效率,以五年使用周期計(jì),平均可以實(shí)現(xiàn)以一臺(tái)新的服務(wù)器替代五臺(tái)舊服務(wù)器,在某些用例中該比例可達(dá)10:1,從而節(jié)省高達(dá)68%的總體擁有成本(TCO)。
上述特性使得至強(qiáng)6700/6500性能核處理器在性能與能效平衡方面表現(xiàn)更為出色,更加符合數(shù)據(jù)中心需求。
英特爾數(shù)據(jù)中心與AI集團(tuán)副總裁兼中國(guó)區(qū)總經(jīng)理陳葆立介紹,最新推出的6700/6500性能核處理器目標(biāo)是傳統(tǒng)數(shù)據(jù)中心企業(yè)應(yīng)用。相比高核高密度計(jì)算的大芯片,這些新品的TDP也比較適合傳統(tǒng)機(jī)架,比如150W-350W的TDP,在內(nèi)存通道上也有8個(gè)內(nèi)存通道的配置。
同時(shí)在內(nèi)存技術(shù)方面,英特爾推出了MRDIMM技術(shù),顯著提升了內(nèi)存帶寬,可以更好地支持AI工作負(fù)載。MRDIMM技術(shù)是首次在至強(qiáng)6產(chǎn)品上推出,相比第五代至強(qiáng)的內(nèi)存速度4800-5600MT/s,至強(qiáng)6速度提升至DDR5 6400MT/s,而、MRDIMM進(jìn)一步將速率提升至8800MT/s,相比現(xiàn)有數(shù)據(jù)中心服務(wù)器提升超過(guò)50%。據(jù)透露,很多客戶對(duì)此表現(xiàn)出濃厚興趣,并正在進(jìn)行快速試驗(yàn)以期快速落地。
陳葆立指出,傳統(tǒng)AI應(yīng)用如推薦引擎、語(yǔ)音助手和圖像識(shí)別等,適合CPU處理。全新的至強(qiáng)6處理器憑借多核、高內(nèi)存帶寬、AI加速指令和完整軟件棧,是支持傳統(tǒng)AI應(yīng)用的理想選擇。
對(duì)于大語(yǔ)言模型來(lái)說(shuō),盡管需要GPU等加速器,但每個(gè)GPU系統(tǒng)仍需兩顆CPU作為機(jī)頭,以加快數(shù)據(jù)傳輸,這要求CPU具備快速I/O、良好單核性能和更快內(nèi)存。此外,GPU服務(wù)器長(zhǎng)時(shí)間運(yùn)行對(duì)系統(tǒng)穩(wěn)定性要求極高,至強(qiáng)處理器憑借其可靠性和穩(wěn)定性,成為智算中心和GPU服務(wù)器設(shè)計(jì)的重要選擇。
“在小于20B的模型規(guī)模下,用至強(qiáng)進(jìn)行生成式AI的推理很有優(yōu)勢(shì)。因?yàn)閷?duì)小規(guī)模大語(yǔ)言模型來(lái)說(shuō),推理過(guò)程在生成首個(gè)Token時(shí)需要密集計(jì)算,后續(xù)多數(shù)Token推理則對(duì)內(nèi)存帶寬需求高”,英特爾技術(shù)專家補(bǔ)充,“至強(qiáng)6處理器結(jié)合MRDIMM技術(shù),可提升性能,128核至強(qiáng)AP平臺(tái)性能甚至超競(jìng)品50%核心平臺(tái),MRDIMM帶寬達(dá)8800MT/s,對(duì)性價(jià)比要求高的中小模型推理重要?!?/p>
據(jù)英特爾技術(shù)專家分析,當(dāng)前客戶面臨的兩類問(wèn)題比較突出:一是系統(tǒng)老舊問(wèn)題,需考慮是否更換新系統(tǒng),這涉及更新TCO的ROI計(jì)算。以目前市面上應(yīng)用廣泛的五年更新周期的第二代至強(qiáng)為例,客戶關(guān)注空間與能耗節(jié)省,更新后可實(shí)現(xiàn)10:1整合比例,節(jié)省約2/3的TCO,鼓勵(lì)客戶更新基礎(chǔ)設(shè)置。
其二,在客戶采購(gòu)時(shí),需對(duì)比市面同類產(chǎn)品。至強(qiáng)AP平臺(tái)在傳統(tǒng)數(shù)據(jù)、網(wǎng)絡(luò)服務(wù)、科學(xué)計(jì)算及AI領(lǐng)域性能優(yōu)于競(jìng)品。至強(qiáng)6處理器系列,包括SP平臺(tái)的6700P和6500P系列,在傳統(tǒng)AI推薦系統(tǒng)、科學(xué)計(jì)算、網(wǎng)絡(luò)服務(wù)、圖像構(gòu)建等業(yè)務(wù)中,帶來(lái)顯著性能提升與TCO節(jié)省。
據(jù)透露,英特爾將在2026年發(fā)布采用18A制程的下一代至強(qiáng)Clearwater Forest,目前進(jìn)展順利,這也將會(huì)是英特爾至強(qiáng)處理器發(fā)展歷程中下一個(gè)重要的里程碑。
面向網(wǎng)絡(luò)和邊緣應(yīng)用的英特爾至強(qiáng)6處理器SoC——提供高性能與能效
英特爾同時(shí)還推出一款面向網(wǎng)絡(luò)和邊緣應(yīng)用的至強(qiáng)6處理器,它是一款系統(tǒng)級(jí)芯片(SoC),集成多種加速器,旨在提供高性能與能效。該產(chǎn)品主要面向運(yùn)營(yíng)商,涵蓋從辦公室到數(shù)據(jù)中心的網(wǎng)絡(luò)與邊緣領(lǐng)域,涉及多樣化工作負(fù)載,兼顧計(jì)算密度、連接性能、功耗及物理尺寸,整合了多種安全和控制功能。
由于至強(qiáng)6系統(tǒng)級(jí)芯片定位于網(wǎng)絡(luò)與邊緣場(chǎng)景,因此針對(duì)多樣化的功能特性進(jìn)行了高度集成。它融合了英特爾至強(qiáng)6性能核處理器特性,核心數(shù)達(dá)72個(gè),整合了多種加速器,例如:整合vRAN boost技術(shù)、英特爾媒體轉(zhuǎn)碼加速器及英特爾AMX等加速器等,實(shí)現(xiàn)了功耗性能的平衡優(yōu)化。
據(jù)英特爾中國(guó)網(wǎng)絡(luò)與邊緣事業(yè)部總經(jīng)理阮伯超介紹,至強(qiáng)6 SoC廣泛應(yīng)用于運(yùn)營(yíng)商網(wǎng)絡(luò)及網(wǎng)絡(luò)與邊緣領(lǐng)域,所實(shí)現(xiàn)的優(yōu)勢(shì)包括:在運(yùn)算網(wǎng)絡(luò)中,為vRAN帶來(lái)高性能功耗比增長(zhǎng),如與諾基亞合作提升了70%的性能功耗比,從而幫助運(yùn)營(yíng)商提升了整體密度,達(dá)到2.4倍的無(wú)線接入網(wǎng)(RAN)工作負(fù)載容量;在AI領(lǐng)域,通過(guò)內(nèi)置英特爾AMX使單核AI RAN性能較上一代提升3.2倍;在網(wǎng)絡(luò)安全領(lǐng)域,大幅提升Webroot CSI上傳模型推理速度,相比英特爾至強(qiáng)D-2899NT處理器提升最高達(dá)4.3倍。
作為首款媒體轉(zhuǎn)碼加速器的服務(wù)器SoC,至強(qiáng)6 SoC在編解碼時(shí)可以實(shí)現(xiàn)較大的性能功耗比提升。相較于英特爾至強(qiáng)6538N處理器,每瓦性能提升達(dá)到了14倍。同時(shí),內(nèi)置的媒體加速器也可以幫助傳統(tǒng)的VDI(虛擬桌面基礎(chǔ)架構(gòu))領(lǐng)域,提升媒體的處理效率,減少總體擁有成本。
值得注意的是,由于網(wǎng)絡(luò)與邊緣領(lǐng)域,智算網(wǎng)融合是一個(gè)重要方向。以 AI 應(yīng)用為例,邊緣服務(wù)器可應(yīng)用于智能工廠,助力礦山開(kāi)采作業(yè),亦能用于智能攝像頭相關(guān)場(chǎng)景。用于這些場(chǎng)景的設(shè)備需要集成多種網(wǎng)絡(luò)功能,如 SD-WAN(軟件定義廣域網(wǎng)),同時(shí)整合安全功能。更為重要的是,它將各類 AI 應(yīng)用集成于一體,例如智能監(jiān)控與安全監(jiān)控應(yīng)用。通過(guò)性能均衡設(shè)計(jì),將英特爾AMX和英特爾媒體轉(zhuǎn)碼加速器集成在同一設(shè)備中,通過(guò)一個(gè)38核系統(tǒng)可以同時(shí)支持38路攝像頭視頻流的int8推理,系統(tǒng)實(shí)現(xiàn)了功耗、性能的平衡和優(yōu)化。
AI算力需求井噴,至強(qiáng)6如何滿足數(shù)據(jù)中心需求?
隨著AI算力需求的不斷增長(zhǎng),至強(qiáng)6如何成為符合AI大模型需求的“多面手”?
陳葆立指出,早在大模型興起之前,AI就已經(jīng)廣泛應(yīng)用于數(shù)據(jù)中心,包括推薦引擎和搜索等領(lǐng)域,國(guó)內(nèi)許多大型互聯(lián)網(wǎng)企業(yè)一直使用大量的至強(qiáng)處理器來(lái)支持這些業(yè)務(wù)。多年來(lái),英特爾推出了多種AI加速技術(shù),例如AMX加速器,幫助客戶提升AI計(jì)算性能。相比友商,英特爾在支持AI場(chǎng)景方面充滿信心,技術(shù)上也具有明顯優(yōu)勢(shì)。
面對(duì)大規(guī)模應(yīng)用的GPU服務(wù)器,陳葆立認(rèn)為,機(jī)頭位置的CPU選擇至關(guān)重要。因?yàn)樘幚泶竽P陀?jì)算時(shí)需要著重關(guān)注兩個(gè)性能指標(biāo):一是提問(wèn)后第一個(gè)回答的延遲時(shí)間,二是CPU內(nèi)存帶寬,因?yàn)镃PU需要快速調(diào)取數(shù)據(jù)進(jìn)行分析并給出響應(yīng)。
“盡管隨著更多新模型的出現(xiàn),客戶對(duì)推理算力的需求增加,但并非所有場(chǎng)景都需要超大規(guī)模模型??蛻糸_(kāi)始關(guān)注至強(qiáng)6處理器與MRDIMM的組合是否能在不同場(chǎng)景下有效支持大模型運(yùn)算。我們已經(jīng)證明,這種組合是可行的。盡管國(guó)內(nèi)有許多不同類型的加速卡,現(xiàn)階段最新一代至強(qiáng)6處理器系列依然是客戶和合作伙伴的首選平臺(tái),并且能夠進(jìn)行更好的適配和驗(yàn)證”,陳葆立強(qiáng)調(diào)。