• 正文
    • 至強首次拆分為兩大系列:P核/性能核和E核/能效核
    • 剖析至強6設(shè)計理念和亮點:接口、互連、封裝等
    • 聚焦數(shù)據(jù)中心新挑戰(zhàn),生態(tài)合作應(yīng)對多樣化需求
    • 結(jié)語
  • 推薦器件
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

數(shù)據(jù)中心壓力陡增,英特爾“殺手锏”CPU掀起效率革命!

原創(chuàng)
2024/06/13
1518
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

英特爾近日重磅發(fā)布了首款配備能效核的至強6處理器(代號Sierra Forest),為高密度、橫向擴展工作負載帶來性能與能效的雙重提升。

英特爾CEO帕特·基辛格(Pat?Gelsinger)在臺北舉行的Computex上,高調(diào)指出了至強6的重要意義,他表示,“至強6在我們的競爭力上是向前邁出的一大步,不僅保住了我們的市場,而且重新獲得了我們失去的一些市場份額機會?!敝翉?有哪些優(yōu)點?如何能夠“擔(dān)此重任”?它對AI大模型競爭激烈的當(dāng)下有哪些重要意義?

至強首次拆分為兩大系列:P核/性能核和E核/能效核

ChatGPT為代表的生成式AI在迅速演進。幾個月前,我們與它的交互還是文字對話,但近來ChatGPT升級后,不僅支持語音交互,而且溝通過程中被“打斷”,也能迅速做出反應(yīng),給出滿意的答復(fù)。

這種非常實時的、始終處于激活狀態(tài)下的AI應(yīng)用,對算力帶來的挑戰(zhàn)實際是巨大的,畢竟數(shù)據(jù)中心不能一味擴張,效率、TCO、能源消耗等等都是需要直面的重大問題。

英特爾數(shù)據(jù)中心與人工智能集團副總裁兼中國區(qū)總經(jīng)理陳葆立指出,AI技術(shù)架構(gòu)內(nèi)的設(shè)施非常昂貴,以更好的硬件架構(gòu)提升效率、降低成本,是非常重要的方向。

至強6首次對至強產(chǎn)品線進行了拆分,分為P核/性能核和E核/能效核。針對計算密集型和AI工作負載等應(yīng)用,比如大數(shù)據(jù)、AI推理、游戲等,用P核處理器;E核的優(yōu)勢則是在微服務(wù)、云原生、數(shù)據(jù)庫、網(wǎng)絡(luò)等方面,主要針對高核心密度和規(guī)模擴展任務(wù)所需的高效能進行了優(yōu)化。兩者架構(gòu)兼容,共享軟件棧和開放的軟、硬件供應(yīng)商生態(tài)。

以企業(yè)服務(wù)器5年升級更新一次為例,將至強6的E核/能效核與第二代至強相比,在媒體處理、網(wǎng)絡(luò)處理、微服務(wù)等方面基本可以實現(xiàn)2-3倍的性能提升,幫助企業(yè)用戶實現(xiàn)更好的性能與能效平衡。

P核/性能核主要面向云廠商、互聯(lián)網(wǎng)企業(yè)等,由于他們所提供的云服務(wù)需要更好、更快的刷新速度,因此基本會逐代進行升級更新。至強6的P核/性能核對比第五代至強,在AI、HPC等工作負載方面,也都實現(xiàn)了2倍以上的性能提升。

除了至強產(chǎn)品線的代際提升對比,英特爾也公布了對標友商產(chǎn)品的情況:不論是AI推理運算還是媒體處理,在性能和能效方面,至強6都實現(xiàn)了明顯的性能提升。

此次推出的英特爾至強6能效核處理器基于Intel 3制程工藝,憑借高核心密度及出色的每瓦性能,可在提供高效算力的同時顯著降低能源成本。性能與能效的升級使其非常適合要求嚴苛的高密度、橫向擴展工作負載,包括云原生應(yīng)用和微服務(wù)化網(wǎng)絡(luò)功能、分布式數(shù)據(jù)分析、內(nèi)容分發(fā)網(wǎng)絡(luò),以及消費者數(shù)字服務(wù)等。

據(jù)陳葆立介紹,企業(yè)通過將其數(shù)據(jù)中心服務(wù)器升級至最新的至強6能效核CPU,能夠顯著提升能效和空間利用率。相比原來的服務(wù)器,新款CPU在保持相同算力的前提下,僅需原來1/3的服務(wù)器數(shù)量,從而節(jié)約了2/3的機柜空間。這種升級不僅有助于實現(xiàn)數(shù)據(jù)中心的節(jié)能減排,還能在節(jié)省出的空間中部署更多服務(wù)器或AI硬件,增強整體計算能力。

除了本次亮相的能效核產(chǎn)品之外,英特爾至強6性能核處理器(代號Granite Rapids)預(yù)計將于下季度推出。

剖析至強6設(shè)計理念和亮點:接口、互連、封裝等

云服務(wù)和企業(yè)級應(yīng)用對AI訓(xùn)練、大數(shù)據(jù)處理、存儲、微服務(wù)和流媒體等計算服務(wù)的需求日益增長,因此,硬件和云服務(wù)提供商必須在研發(fā)成本、性能、功耗、能效、利用率以及安全和可靠性等多個方面進行權(quán)衡。

“數(shù)據(jù)中心在處理多樣化計算需求時面臨的挑戰(zhàn),正是英特爾至強6在設(shè)計時需要充分考慮的問題”,英特爾的一位資深技術(shù)專家表示。

至強6系列處理器包括能效核6700和性能核6900兩個平臺,它們均采用性能核和能效核的組合,形成2×2矩陣,滿足不同用戶的需求。這兩個平臺基于相同的底層技術(shù)構(gòu)建,確保了高度兼容性的同時簡化了開發(fā)驗證過程。

6700和6900系列均增強了PCIe和CXL接口的數(shù)量,以及CPU間互連的UPI帶寬。最新發(fā)布的6700系列產(chǎn)品,配備了144個能效核,據(jù)稱,即將發(fā)布的6900系列則進一步將能效核數(shù)量翻倍至288個。

從微架構(gòu)角度來看,性能核由于集成了AVX-512和AMX等向量和矩陣運算單元,為高并發(fā)計算任務(wù)(如AI和科學(xué)計算等),提供了高性能的計算能力。再結(jié)合MCR內(nèi)存技術(shù),性能核能夠獲得更高的帶寬支持,進一步增強了其處理能力。

此外,在亂序執(zhí)行方面,性能核提供了512長度的亂序執(zhí)行引擎,能夠更好地優(yōu)化編程中的軟件指令,可以更大程度使用后面的執(zhí)行引擎,這是延續(xù)英特爾以往的產(chǎn)品路線圖的性能核產(chǎn)品。

與此相對,能效核則是英特爾在服務(wù)器端新引入的產(chǎn)品版本,它通過簡化和裁剪一些功能來優(yōu)化能效比。例如,能效核不具備AVX-512和AMX功能,同時,它對L2緩存進行了調(diào)整,從每個核心2M降至1M,同時L3緩存容量也有所不同。這些調(diào)整減少了每個能效核心的硅片面積和功耗,使得在相同的芯片面積或功耗限制下,能夠提供更多的核心數(shù)量,從而實現(xiàn)更高的吞吐量。

封裝構(gòu)造的角度來看,至強6的設(shè)計理念也有很大改變。例如第五代至強處理器中采用EMIB技術(shù),是通過兩個芯片的組合,突破了傳統(tǒng)尺寸限制,集成了更多復(fù)雜邏輯功能,從而提升性能和功能性。而至強6不再是簡單的尺寸劃分,而是依據(jù)功能塊進行劃分,中間為計算die,上下為I/O die,由于I/O die與高速I/O緊密相關(guān),對密度要求較低,因此可以采用成熟的Intel 7工藝,而計算die對計算密度及核心邏輯密度要求比較高,因此采用最新的Intel 3制程工藝。

基于能效核至強6700系列,由一個計算die和兩個I/O die構(gòu)成,而6700系列中的性能核產(chǎn)品則根據(jù)核心數(shù)量的不同,分別以XCC、HCC、LCC代表高中低檔的芯片版本,它們共享相同的封裝和平臺設(shè)計,核心數(shù)量有區(qū)別,以適應(yīng)不同的業(yè)務(wù)需求。

配備性能核的至強6900系列在I/O die的形狀和數(shù)量上與6700系列保持一致,每個芯片包含兩個I/O die,但計算核心數(shù)量有所增加。6900使用了與XCC相同的計算單元,通過增加計算單元的數(shù)量,將核心數(shù)量提升了約50%。與此同時,6900系列和6700系列的能效核采用了同樣的計算單元,只是數(shù)量從單片增至雙片、核心數(shù)量從144個增至288個,以實現(xiàn)更高的并行處理能力。

基于這些新特性,可以說最新的至強6系列融合了英特爾在封裝技術(shù)和制程工藝上的進步,而至強6模塊化設(shè)計和功能優(yōu)化的背后,是一系列關(guān)鍵技術(shù)的支撐。首先是Fabric技術(shù),它充當(dāng)了計算die與I/O die之間的橋梁,實現(xiàn)了兩者的有機結(jié)合。其次,系統(tǒng)架構(gòu)能夠集成多個die,即使在涉及多個芯片的情況下,也能通過Fabric技術(shù)將它們無縫連接成一個協(xié)調(diào)一致的系統(tǒng)。這種設(shè)計巧妙地將每個芯片內(nèi)部的通路網(wǎng)絡(luò)擴展并融合,形成一個更大規(guī)模、更強大的整體通路系統(tǒng)。這不僅優(yōu)化了數(shù)據(jù)傳輸的效率,而且顯著提升了處理器的功能和性能。

此外,EMIB(嵌入式多芯片互連橋接)技術(shù)也發(fā)揮了重要作用,它以極高密度實現(xiàn)了芯片間的橋接,支持die間達到1TB/s的傳輸速度,確保了跨die連接的帶寬無損通信

CXL 2.0技術(shù)也值得關(guān)注,這是一項由英特爾發(fā)明并不斷完善的創(chuàng)新技術(shù),旨在增強處理器的功能和性能。CXL 2.0特別為Type 3設(shè)備提供了增強功能,包括鏈路細分和QoS(Quality of Service)控制,主要面向內(nèi)存擴展的使用場景。CXL Numa node模式允許系統(tǒng)的標準DRAM內(nèi)存和通過CXL技術(shù)擴展的內(nèi)存作為兩個獨立的Numa節(jié)點存在,并可通過軟件進行控制。這種分層管理允許優(yōu)化配置,同時對上層業(yè)務(wù)透明,是CXL技術(shù)的一種管理模式。

針對無法修改軟件以適應(yīng)CXL內(nèi)存擴展的客戶,英特爾提供了硬件管理方案。異構(gòu)交織(Hetero Interleaved)模式將系統(tǒng)原生的DRAM內(nèi)存和CXL內(nèi)存在地址上進行混合,實現(xiàn)內(nèi)存帶寬的平衡擴展,而應(yīng)用程序對CXL內(nèi)存的感知和管理被最小化。這種模式為系統(tǒng)提供了更大的內(nèi)存帶寬,同時保持了系統(tǒng)的高性能吞吐。

另一種模式是Flat memory mode,它通過硬件輔助實現(xiàn)CXL和原生DRAM之間的分層管理。在這種模式下,常用數(shù)據(jù)被優(yōu)先存儲在DRAM中,而其他數(shù)據(jù)則存儲在CXL內(nèi)存中,使得CXL內(nèi)存的性能接近于原生的DRAM性能,從而為用戶提供了高性能的內(nèi)存解決方案。通過這些模式,CXL 2.0技術(shù)為用戶提供了靈活的內(nèi)存擴展和管理選項。

聚焦數(shù)據(jù)中心新挑戰(zhàn),生態(tài)合作應(yīng)對多樣化需求

隨著新一代至強6的推出,英特爾有望針對中國數(shù)據(jù)中心市場需求,推出更高效、節(jié)能的解決方案。至強6發(fā)布會上,多家本土生態(tài)伙伴展示了基于英特爾至強6能效核產(chǎn)品的最新解決方案。

金山云推出了搭載該處理器的金山云第九代高效型云服務(wù)器SE9,該服務(wù)器在計算、網(wǎng)絡(luò)、存儲等多個維度進行了深度優(yōu)化,提升了核心密度和關(guān)鍵工作負載的運行效率。

浪潮信息發(fā)布了基于至強6能效核處理器的新一代服務(wù)器,以其高效節(jié)能、安全可靠、靈活架構(gòu)和智能開放的核心特性,提高了算力基礎(chǔ)設(shè)施的利用率,并降低了運營成本,有效應(yīng)對當(dāng)前數(shù)據(jù)中心面臨的能耗挑戰(zhàn)。

南大通用分享了為提高數(shù)據(jù)中心能效比而打造的分布式邏輯數(shù)據(jù)倉庫解決方案,該方案利用至強6能效核處理器的多核優(yōu)勢和工藝與微架構(gòu)的創(chuàng)新,提升了業(yè)務(wù)部署密度和單節(jié)點性能。

記憶科技則將“低碳節(jié)能”的設(shè)計理念融入基于英特爾至強6的數(shù)據(jù)中心服務(wù)器全生命周期中,推動了高算力與低能耗相結(jié)合的高能效數(shù)據(jù)中心的發(fā)展。

在探討數(shù)據(jù)中心逐漸走向加速計算的趨勢時,英特爾市場營銷集團副總裁兼中國區(qū)行業(yè)解決方案和數(shù)據(jù)中心銷售部總經(jīng)理梁雅莉表示,數(shù)據(jù)中心的算力架構(gòu)正在不斷變遷,隨著生成式AI的快速發(fā)展,對算力的需求變得更加多樣化?,F(xiàn)代數(shù)據(jù)中心不再依賴單一的算力架構(gòu)滿足所有客戶需求,而是需要針對不同的應(yīng)用場景和業(yè)務(wù)負載提供定制化的解決方案,算力架構(gòu)的多樣性和異構(gòu)發(fā)展將是一個明顯的趨勢。

金山云高級副總裁劉濤進一步闡述,盡管企業(yè)在AI算力方面投入很大,但在整個AI業(yè)務(wù)流程中,主要是訓(xùn)練環(huán)節(jié)對算力需求較高。他指出,AI的整個生命周期包括數(shù)據(jù)抓取、清洗、重組、管理、訓(xùn)練和核心功能使用等多個環(huán)節(jié),而加速算力主要針對矩陣并行運算,標準的通用算力仍然非常重要。

談及多樣化工作負載需求下,服務(wù)器的設(shè)計和部署挑戰(zhàn)時,浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥提到,英特爾可提供完善和全面的生態(tài)系統(tǒng)支持,除此之外,面對業(yè)界多樣化和碎片化的算力需求,OEM廠商需要采用解耦的開發(fā)模式,將平臺開發(fā)與產(chǎn)品開發(fā)分離,以提前進行平臺開發(fā)并適配多個產(chǎn)品。這種方式不僅保證了產(chǎn)品的敏捷迭代,也簡化了用戶端的部署和使用,并且能夠滿足客戶迅速采用最新處理器的需求。

記憶科技(深圳)有限公司服務(wù)器產(chǎn)品線總經(jīng)理朱勁松補充,硬件是基礎(chǔ),如果沒有硬件的支持,軟件的效率將大大降低。他認為,英特爾提供的能效核和性能核是解決效率和性能問題的根本方案。此外,他強調(diào)了模塊化設(shè)計的重要性,模塊化允許產(chǎn)品的各個模組靈活組合,以支持不同的冷卻方式和存儲需求,從而更好地滿足不同客戶的硬件需求。

結(jié)語

英特爾至強6處理器的推出,是英特爾在構(gòu)建高效能、多樣化數(shù)據(jù)中心生態(tài)系統(tǒng)方面的重要一步。梁雅莉強調(diào),英特爾至強6能效核處理器專為云原生應(yīng)用和大規(guī)模分布式工作負載設(shè)計,能夠滿足云化數(shù)據(jù)中心對高性能、高密度和高能效的需求,同時有效降低數(shù)據(jù)中心的總體擁有成本(TCO)。英特爾期望與行業(yè)伙伴緊密合作,共同開發(fā)創(chuàng)新的端到端解決方案,以支持企業(yè)在數(shù)字化轉(zhuǎn)型中取得成功。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
ATXMEGA16D4-AU 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQFP44, 10 X 10 MM, 1 MM HEIGHT, 0.80 MM PITCH, GREEN, PLASTIC, MS-026ACB, TQFP-44

ECAD模型

下載ECAD模型
$3.06 查看
ATXMEGA32A4U-MHR 1 Microchip Technology Inc IC MCU 8BIT 32KB FLASH 44VQFN
$2.99 查看
ATMEGA64-16AU 1 Microchip Technology Inc IC MCU 8BIT 64KB FLASH 64TQFP

ECAD模型

下載ECAD模型
$19.46 查看
英特爾

英特爾

英特爾在云計算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。

英特爾在云計算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。收起

查看更多

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄