英偉達新推出的 GeForce GTX 1080 游戲顯卡采用了該公司最新的帕斯卡架構,并且使用了采用 16nm FinFET 工藝制造的芯片。GTX 1080 上的 GP104 圖形處理單元包含 72 億顆晶體管,運行速度可達 1.6GHz,可以超頻至 1.733 GHz。這顆芯片的硅片尺寸為 314 平方毫米,比前一代 GeForce GTX 980 上采用 28nm 工藝生產制造的圖形處理器小了 21%。據(jù)稱,開發(fā)這項技術花了英偉達 20 多億美金。
GeForce GTX 1080 使用了圖形處理單元(GPU)架構,說是可以突破功耗 / 性能的平衡。但是,當把 GPU 和標準的中央處理單元(CPU)放在一起比較時,哪個表現(xiàn)更勝一籌呢?再或者與更類似 GPU 且成功進入高性能計算系統(tǒng)的現(xiàn)場可編程門陣列(FPGA)相比呢?
AMD 公司的技術和工程高級副總裁 Mark Papermaster 在 DAC 的一次主題演講中吹捧“摩爾定律+”時代的到來。他說,CPU、GPU 和加速器可以帶來沉浸式的計算體驗。業(yè)界已經(jīng)認識到,這種計算能力“需要采取系統(tǒng)設計方法才能達到”。
每種類型的計算引擎都有各自的優(yōu)點。CPU 能夠在低延遲下實現(xiàn)高負載的運算,GPU 能實現(xiàn)最高的單管腳帶寬,而 FPGA 則可以用于多種通用設計。
但是同樣,每種引擎也都有各自的局限性。CPU 需要在先進的工藝節(jié)點下實現(xiàn)更高的整合,GPU 則受限于能放在其上的內存大小的限制。
“FPGA 能夠連接到和 CPU 一樣類型的存儲器,”Rambus 公司企業(yè)級解決方案技術副總裁兼杰出發(fā)明家 Steven Woo 稱。“FPGA 這種芯片的靈活性特別高,對于特定的應用或加速應用,他們能夠改進性能,并實現(xiàn)更佳的能源效率。”
英特爾公司去年年底完成了以 167 億美金收購 Altera 公司的交易,看中的就是 FPGA 能夠提供的靈活計算加速能力。微軟在其 Bing 搜索引擎中采用 FPGA 來提升性能,因為 FPGA 能夠幫助其實現(xiàn)成本和功耗的平衡。不過,采用 FPGA 來設計低功率、高性能的設備卻不是一件容易的事情。
“現(xiàn)在提供一個通用的解決方案越來越難了,”Woo 表示?!耙恍┰O計團隊開始設計時采用 FPGA,然后把在 FPGA 中開發(fā)的邏輯固化成一顆 ASIC,他們起步時采用 FPGA,然后觀察一下市場的增長情況,這可以幫助他們合理地評估開發(fā) ASIC 的成本?!?/p>
除了在許多微處理器中使用的行業(yè)標準 x86 架構,ARM 的架構主宰著移動器件市場,并正在針對數(shù)據(jù)中心和服務器進行細化調整。市場上有來自開源 RISC-V 的 ARM 架構開源內核、出自 OpenPower 的 POWER CPU 架構,在 x86 領域也有來自 AMD 的競爭。不過,最終選擇哪種芯片取決于使用情況和具體應用。
“這種決策需要平衡考慮成本,性能和功耗,”Woo 表示?!癈PU 仍然是非常好的中流砥柱,也很靈活?!碑斦劦?CPU 上運行的軟件程序時,Woo 表示,“不一定非要寫成向量化代碼?!?/p>
GPU 能夠實現(xiàn)更好的圖形接口,他們比通用 CPU 更具有針對性。FPGA 則能覆蓋多個市場,最近它們甚至開始進入數(shù)據(jù)中心和超級計算機領域。
“人們編寫的代碼所涉及的領域每個月都會發(fā)生變化,而且這種變化以各自的方式在加速,”Woo 表示。可重復編程和可重新配置的 FPGA 可以適配用于各種算法,“不用經(jīng)歷設計 ASIC 帶來的痛苦?!?/p>
ARM 公司 CPU 事業(yè)部技術總監(jiān) Peter Greenhalgh 表示,CPU 代表著“芯片世界強大有力的一面?!痹诹硪环矫?,他指出,對于高帶寬的計算,“GPU 的表現(xiàn)非常好?!?/p>
可編程能力雖好,但并非處處通吃
FPGA 介于入 CPU 和 GPU 之間,這使得它們很適合用于工業(yè)、醫(yī)療和軍事設備,在這些領域中 FPGA 發(fā)展勢頭良好,但即使在那里,F(xiàn)PGA 也并非通吃。
萊迪思半導體公司的工業(yè)和汽車事業(yè)部產品營銷總監(jiān) Deepak Boppana 指出,萊迪思歷史上是一個 FPGA 公司。“今天,我們擁有更廣泛的產品組合,”他說,并特別指出增加了專用標準器件(ASSP)這一產品品類。
“我們和其它 FPGA 公司不同,”Boppana 繼續(xù)說道。萊迪思的 FPGA 可以提供“更低的功耗、更低的成本,以及不同形式的外形?!?/p>
根據(jù) Boppana 的說辭,萊迪思特別重視將可連接性加入到其產品線中。通過收購 Silicon Image 公司,萊迪思現(xiàn)在擁有針對 HDMI 應用和其他用途的 ASSP。該公司目前提供用于攝像頭和顯示器的 CrossLink 橋接芯片,該芯片是一顆可編程 ASSP,可在低于 10 毫瓦的功耗下運行,同時以每秒 12Gbits 的速度支持 4K 超高清視頻。
Boppana 表示,該芯片集成了很多硬 IP,并擁有 FPGA 的靈活性。CPU 和 GPU 通常不具備正確類型的接口。“CPU 能很好地實現(xiàn)多路控制,但一般都不具備多路數(shù)據(jù)接口?!?/p>
英特爾收購 Altera 的行為表明了“采用 FPGA 對 CPU 進行加速的趨勢”,他說。目前的趨勢是將 CPU 和 FPGA 搭配或集成在一起用于高性能計算應用。
Lattice 則另辟蹊徑,“不針對高負荷計算加速,”Boppana 說。“我們做的是用于低端市場的更小的東西。”該公司的 FPGA 主要針對消費電子和物聯(lián)網(wǎng),正好是云計算等大型重度計算的反方向。對客戶來說,選擇芯片類型時會“歸結到他們的具體要求”,Boppana 總結道。因此,他們可以選擇 CPU 以獲得最佳性能?!爱斝枰獫M足多種性能水平,并具備廣泛的接口時,F(xiàn)PGA 開始變得更具吸引力。很多客戶都會同時使用 FPGA 和 CPU?!?/p>
Cadence 公司 IP 事業(yè)部首席技術官 Chris Rowen 說道,許多現(xiàn)成的硅解決方案,如 ASSP 和 SoC,被應用到了很多硬件平臺上?!耙话闶怯迷诘褪袌鋈萘亢透吒郊又颠@些情形中,”他指出。“現(xiàn)成的硅方案比你能想到或負擔得起的更通用。”
Rowen 補充說。“對很多這些應用,有多種針對特定應用的產品,這樣的手機應用處理器或那樣的手機應用處理器?!?/p>
所以,設計者應該選擇 CPU、GPU 還是 FPGA 呢?“正確的答案是,在很多情況下,一樣也不選,要選 ASSP。”Rowen 說道?!澳阈枰环N混合芯片或聚合器件?!?/p>
業(yè)界已經(jīng)習慣于在板級進行集成,Rowen 說?!鞍寮壖稍谝恍┣樾蜗率潜仨毜?,”他說。這種選擇的缺點是“成本相對高價、功耗也較高?!?/p>
FPGA 可以填補對小批量 ASSP 的需求,CPU 架構則可以與 FPGA 互補。對于 GPU,“則取決于你想要進入哪個細分市場?!边@方面主要包括兩大類顯卡:用于游戲和其它應用的高性能顯卡,以及更多更傾向于嵌入式類型的產品,比如汽車和消費級產品,功率預算介于 5 瓦和 10 瓦時間?!?0 到 20 年前存在 CPU 市場,然后它也發(fā)生了變化,現(xiàn)在主要針對服務器或 Windows PC。已經(jīng)不是很久之前我可以使用通用芯片的時代了,現(xiàn)在已經(jīng)不存在通用 CPU 芯片了?!?/p>
簡單來說,處理器市場都已經(jīng)被定向了,這反映在不同的應用上。在高性能計算或超級計算應用中,GPU 通常被用在基礎設施的配置上,IO 則用于系統(tǒng)的擴展,他說。
Rowen 提到了英特爾和 Altera 的合并。“加速器綁定到基礎設施上,這是 FPGA 可以發(fā)揮作用的地方,”他說,“英特爾和 Altera 的團隊正在通力協(xié)作,我肯定能夠看到英特爾服務器處理器芯片的優(yōu)化越來越好,并且和 FPGA 一起在服務器中服役?!?/p>
在英特爾的高性能計算戰(zhàn)略中,Knights Landing 處理器是非常關鍵的一個因素。
“在大批量的應用中,使用 ASIC 是個非常常見的選擇,而在一些產量要求并不高但需要一些特定功能的應用中,ASIC 也有用武之地?!彼f。在這種應用中選用 ASIC 的缺點是,為了滿足特定需求而不得不承受 ASIC 的高成本。公司始終都需要計算盈虧平衡點。Rowen 指出,有一些可以替代 FPGA 的方案,比如由 eASIC 公司提供的金屬可編程芯片。“也許,你可以轉用一次性工程費用低且出貨量大的 ASIC?!?/p>
從 Rowen 的角度來看,設計路線為從 FPGA 到中低批量 ASIC,再到大批量 ASIC,最后到客戶自有工具(COT)。
那么,到底該選擇什么呢:CPU,GPU,F(xiàn)PGA,ASSP,ASIC?最好的答案依然是:這要看情況。
更多有關 CPU 的資訊, 歡迎訪問 與非網(wǎng) CPU 專區(qū)
與非網(wǎng)編譯,未經(jīng)許可,不得轉載!
?
?