近日,英特爾在一場投資者網(wǎng)絡(luò)研討會中披露了數(shù)據(jù)中心業(yè)務(wù)的最新進展。其中包括未來幾代英特爾至強芯片、Habana Gaudi的演進情況,以及第四代英特爾至強可擴展處理器(代號Sapphire Rapids)的最新進展。
在這次會議中,英特爾首次公開宣布了采用Intel 18A制程工藝的Clearwater Forest,根據(jù)此前公布,英特爾計劃在該節(jié)點實現(xiàn)制程工藝領(lǐng)先——這也將是公司四年內(nèi)推進五個制程節(jié)點戰(zhàn)略的高潮。
英特爾至強路線圖概覽
第五代至強今年第四季度交付
Emerald Rapids是英特爾的下一款性能核(P-core)產(chǎn)品。它已經(jīng)被正式稱為第五代英特爾至強可擴展處理器。為了準(zhǔn)備正式發(fā)布,已經(jīng)從代號切換到正式的品牌名稱,目前正在向用戶提供樣品,并計劃于2023年第四季度進行交付,量產(chǎn)驗證正在進行中。
代號“Emerald Rapids”的第五代英特爾至強可擴展處理器
英特爾執(zhí)行副總裁兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera告訴投資者,該產(chǎn)品擁有較高的處理器內(nèi)核性能,在相同功率范圍內(nèi)可實現(xiàn)更高的每瓦性能,同時通過內(nèi)置加速器為具體的工作負(fù)載進行優(yōu)化。
144核至強(代號Sierra Forest)明年上半年上市
Sierra Forest是第一款能效核(E-core)處理器,計劃在2024年上半年上市。它將擁有每插槽144個內(nèi)核,是第一款采用即將推出的Intel 3制程工藝的CPU,在本季度早些時候上電后,多個操作系統(tǒng)在創(chuàng)紀(jì)錄的時間內(nèi)(不到一天)得以啟動。據(jù)介紹,Sierra Forest正在按計劃推進,第一批樣品已經(jīng)交付。
Sierra Forest針對為云優(yōu)化的工作負(fù)載而設(shè)計,將通過優(yōu)化的每瓦性能、高內(nèi)核密度,以及高吞吐量性能針對能效進行優(yōu)化。在演示中,Sierra Forest通過任務(wù)管理器展現(xiàn)了144個內(nèi)核忙碌地處理演示工作負(fù)載的場景。
代號“Sierra Forest”的英特爾至強處理器
代號為Granite Rapids的至強將緊隨而來
Granite Rapids在2024年將緊隨Sierra Forest之后發(fā)布。具體發(fā)布日期尚未披露,不過據(jù)稱,與Sierra Forest共享一個平臺將有利于其快速上市,共享的IP和技術(shù)最大限度地縮短了開發(fā)和設(shè)計時間。Granite Rapids正在實現(xiàn)所有重大里程碑進展,并取得了順利的工廠生產(chǎn)進程。據(jù)透露,其樣品正在向客戶提供,反饋良好。
英特爾公司副總裁兼至強產(chǎn)品部總經(jīng)理Lisa Spelman演示了Granite Rapids的創(chuàng)新,包括更高的內(nèi)核密度、內(nèi)存和I/O創(chuàng)新。她在啟動命令提示符以展示其內(nèi)存配置時表示:“我們正在為Granite Rapids構(gòu)建世界上最快的內(nèi)存接口。英特爾發(fā)明并引領(lǐng)整個生態(tài)系統(tǒng)開發(fā)了一種名為多路合并陣列(MCR)的新型DIMM,使我們能夠在DDR5的基礎(chǔ)上實現(xiàn)每秒8800兆次的傳輸速度?!?/p>
與當(dāng)前一代服務(wù)器內(nèi)存技術(shù)相比,MCR DIMM創(chuàng)新把峰值帶寬增加了80%。Lisa的演示表明,Granite Rapids在健康的內(nèi)存子系統(tǒng)滿載讀/寫操作時非常穩(wěn)定。
CPU市場規(guī)模將超過1100億美元
Sandra Rivera表示,五年后,數(shù)據(jù)中心芯片市場的規(guī)模將達到1100億美元,是去年英特爾投資者大會上所預(yù)期市場規(guī)模的兩倍左右。究其原因,是不斷變化的數(shù)據(jù)中心市場格局?jǐn)U大了目前僅僅針對CPU的需求。
Sandra Rivera解釋道:“當(dāng)談?wù)撚嬎阈枨髸r,我們經(jīng)常通過CPU的出貨量來衡量市場規(guī)模。然而,插槽數(shù)量并不能完全反映芯片創(chuàng)新為市場帶來的價值。如今,創(chuàng)新涉及多個維度,包括提高CPU內(nèi)核的密度、使用芯片中的內(nèi)置加速器,以及使用獨立加速器等?!?/p>
基于上述情況,Sandra Rivera列舉了市場規(guī)模增加的幾個具體原因:首先,隨著數(shù)據(jù)中心業(yè)務(wù)整合加速器計算和領(lǐng)先的GPU產(chǎn)品,英特爾能夠更好地服務(wù)更為廣泛的客戶群體。此外,至強可擴展處理器在運行大型工作負(fù)載(如AI、數(shù)據(jù)分析、安全、網(wǎng)絡(luò)和HPC)方面的出色性能,推動了對主流計算以及為工作負(fù)載“量身定制”的獨立加速器的需求。
布局生成式AI
除了至強芯片的最新情況,AI也是網(wǎng)絡(luò)研討會的一大主題。
據(jù)介紹,Habana Gaudi3人工智能加速器已完成設(shè)計認(rèn)證(tape in)。性能細(xì)節(jié)尚未公布,但Habana Gaudi 2已投入使用,在運行主流的計算機視覺工作負(fù)載時,每瓦吞吐量是同類服務(wù)器的1.8倍。
此外,今年計劃有15款新的FPGA產(chǎn)品通過生產(chǎn)放行資格(PRQ)程序,這是英特爾迄今為止最龐大的FPGA新品發(fā)布。
英特爾首席技術(shù)官兼軟件與技術(shù)集團負(fù)責(zé)Greg Lavender在現(xiàn)場談到了英特爾的先進軟件,以及其對于整體的端到端系統(tǒng)級AI軟件開發(fā)方法的投資,包括為了實現(xiàn)Rivera提到的“可移植性”而推動編程語言的標(biāo)準(zhǔn)化。
此外,英特爾的開放理念延伸到了生成式AI領(lǐng)域,ChatGPT和從文本生成圖像的模型DALL·E 2等強大工具正在利用AI算法和大型數(shù)據(jù)集,從復(fù)雜的人工提示詞中生成內(nèi)容。
機器學(xué)習(xí)應(yīng)用開發(fā)領(lǐng)域的重要廠商Hugging Face宣布在 Habana Gaudi 2上啟用包含1760億個參數(shù)的BLOOMZ模型。BLOOM模型是一個開源的大型語言AI模型,類似于ChatGPT所采用的包含1750億個參數(shù)的GPT-3模型。該公司還證實,它在內(nèi)置英特爾AMX加速器的第四代英特爾至強處理器上運行從文本到圖像的深度學(xué)習(xí)模型Stable Diffusion,并利于其為AI工作負(fù)載加速。