• 正文
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

云服務(wù)商紛紛部署FPGA,讓計(jì)算密集型應(yīng)用大幅度提速

原創(chuàng)
2017/10/30
10
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析、實(shí)時(shí)視頻流處理等計(jì)算密集型應(yīng)用不斷涌現(xiàn),云計(jì)算的應(yīng)用范圍也不斷擴(kuò)展,通過(guò)增加 CPU 數(shù)量提升計(jì)算能力的方式已經(jīng)失去優(yōu)勢(shì),云服務(wù)提供商把目光轉(zhuǎn)向“異構(gòu)計(jì)算”。FPGA 在加速方面的優(yōu)勢(shì)有目共睹,云服務(wù)商紛紛部署專(zhuān)為加速各種高性能工作負(fù)載而優(yōu)化的計(jì)算引擎。首屆賽靈思開(kāi)發(fā)者大會(huì)在北京舉行,作為會(huì)議主辦方,賽靈思及來(lái)自云計(jì)算產(chǎn)業(yè)鏈硬件工程師軟件工程師和嵌入式工程師齊聚一堂,進(jìn)行了技術(shù)交流和產(chǎn)品分享。

眾所周知,軟件工程師的數(shù)量遠(yuǎn)遠(yuǎn)大于硬件工程師的數(shù)量,而隨著 FPGA 的應(yīng)用領(lǐng)域不斷擴(kuò)大,只靠硬件難以服務(wù)于廣大的軟件工程師和嵌入式工程師,因此賽靈思進(jìn)行了重要轉(zhuǎn)型。賽靈思 IP 產(chǎn)品開(kāi)發(fā)高級(jí)副總裁 Salil Raje 介紹,“從 C++到 RTL 的轉(zhuǎn)換是賽靈思轉(zhuǎn)型的核心,包括高層次綜合工具和軟件應(yīng)用工具。這一轉(zhuǎn)型體現(xiàn)在兩個(gè)方面:一是在芯片方面;二是在軟件工具上面。如今賽靈思引入了面向大規(guī)模數(shù)據(jù)中心和加速器領(lǐng)域的 SDAccel 可重配置加速堆棧,以及面向嵌入式系統(tǒng)的 SDSoC 堆棧,把足跡擴(kuò)展到從數(shù)據(jù)中心到嵌入式系統(tǒng)的廣闊領(lǐng)域。以嵌入式系統(tǒng)市場(chǎng)為例,SoC 和 FPGA 的工程師規(guī)模大概有 10 萬(wàn)名,預(yù)計(jì)在五年的時(shí)間里,我們的潛在用戶會(huì)增加五倍,數(shù)量從 5 萬(wàn)增加到 25 萬(wàn)?!?/p>

在解決方案設(shè)置上,賽靈思為更多用戶的差異化創(chuàng)新提供支持。Salil Raje 解釋?zhuān)霸诙松希?SDSoC 開(kāi)發(fā)軟件加上 reVISION 堆棧,開(kāi)發(fā)者可以形成新的使用 MPSoC 的開(kāi)發(fā)方式;在云上,有 SDAccel 加可重配置加速堆棧幫助客戶在云端開(kāi)發(fā)應(yīng)用。由此可見(jiàn),在端上,用 SDSoC 和 reVISION 堆棧可以寫(xiě)出嵌入式的應(yīng)用,在云上,SDAccel 和可重配置加速堆棧使得 IP 可以作為處理器在云端運(yùn)用。reVISION 堆棧的目標(biāo)應(yīng)用是自動(dòng)駕駛汽車(chē)、無(wú)人機(jī)、監(jiān)控,可重配置加速堆棧的目標(biāo)應(yīng)用是超大型數(shù)據(jù)中心和 FPGA 加速應(yīng)用?!?/p>


左:賽靈思戰(zhàn)略市場(chǎng)發(fā)展高級(jí)總監(jiān) Andy Walsh
中:賽靈思 IP 產(chǎn)品開(kāi)發(fā)高級(jí)副總裁 Salil Raje
右:賽靈思全球銷(xiāo)售和市場(chǎng)部亞太及日本地區(qū)總監(jiān) Stephen Chow

FPGA 加速幫助多種應(yīng)用實(shí)現(xiàn)提速


FPGA 云加速有多厲害?這需要應(yīng)用案例來(lái)證明。賽靈思戰(zhàn)略市場(chǎng)發(fā)展高級(jí)總監(jiān) Andy Walsh 介紹了來(lái)自深鑒科技、NGCODEC、Ryft 和 Edico 基因組的應(yīng)用。其中,深鑒科技通過(guò) FPGA 進(jìn)行機(jī)器學(xué)習(xí)推斷、語(yǔ)音識(shí)別,速度可以提高 40 倍;NGCODEC 利用 FPGA 做視頻解碼,HEVC 編碼的幀速率達(dá)到 10 倍加速;彈性搜索是現(xiàn)在企業(yè)最廣泛使用的搜索工具,這可以幫他們找到需要的數(shù)據(jù),同時(shí)把噪音或者干擾的數(shù)據(jù)分離出去,Ryft 專(zhuān)門(mén)做大數(shù)據(jù)搜索,核心競(jìng)爭(zhēng)力在算法,他們使用 FPGA 開(kāi)發(fā)了一款應(yīng)用,可以使彈性搜索加速 90 倍;在醫(yī)學(xué)領(lǐng)域,重危新生兒的基因組測(cè)序和基因?qū)W分析需要快速出結(jié)果,現(xiàn)在通過(guò) Edico 基因組對(duì)醫(yī)學(xué)的貢獻(xiàn),可以把基因組分析和測(cè)序的時(shí)間壓縮從 24 小時(shí)壓縮到 20 分鐘,這一研究結(jié)果已經(jīng)進(jìn)入到吉尼斯世界紀(jì)錄里面。

Andy Walsh 強(qiáng)調(diào),“Edico 除了在亞馬遜云上直接向醫(yī)院銷(xiāo)售以外,還可以向軟件提供商銷(xiāo)售服務(wù),可以在云上面把服務(wù)銷(xiāo)售給醫(yī)院和科研機(jī)構(gòu)。 Edico 的例子對(duì)于賽靈思意味著,規(guī)?;瘯?huì)帶來(lái)巨大的影響。我們只需要很少數(shù)量的云生態(tài)系統(tǒng),就可以聯(lián)系到幾千家企業(yè)和幾百萬(wàn)個(gè)用戶?!?/p>

FPGA 和 CPU 的集成對(duì)兩者都造成損害
“CPU+FPGA”的異構(gòu)架構(gòu)已經(jīng)得到大量應(yīng)用,但是業(yè)界一直在尋求更低功耗、更快速度的解決方案,英特爾自從收購(gòu) Altera 以后,一直致力于把 CPU 和 FPGA 進(jìn)行單芯片集成,從而縮小芯片面積、提高 CPU 和 FPGA 的通信速度,但是這種做法是否切實(shí)有效?Andy Walsh 表示,“過(guò)去一年半的時(shí)間里,F(xiàn)PGA 和 CPU 的集成方式在云計(jì)算領(lǐng)域并不是特別受歡迎,它對(duì)兩者的性能造成很大的損傷,甚至更加嚴(yán)重的損壞,在加速應(yīng)用中,超大規(guī)模的數(shù)據(jù)中心需要非常高端的加速器,串聯(lián)進(jìn)行聯(lián)合。而且 FPGA 和 CPU 集成在功耗上的改善非常有限,一般都是一個(gè)中檔 CPU 和低端的 FPGA 以 1:1 的方式組合,這并不是一個(gè)非常好的解決方案,不能滿足以上的使用案例,而以上的這些案例才是驅(qū)動(dòng) FPGA 應(yīng)用的最大動(dòng)力和發(fā)展趨勢(shì)?!?/p>

“現(xiàn)在我們有一個(gè)名叫 CCIX 的倡議,賽靈思是發(fā)起者之一,F(xiàn)PGA 和 CPU 之間的一個(gè) C16 高速接口,所有 FPGA 的銷(xiāo)售商都一起合作,促成 FPGA 和 CPU 的結(jié)合,包括華為也在做有利于 FPGA 和 FPGA 之間結(jié)合的協(xié)同工作?!盨alil Raje 補(bǔ)充。

未來(lái) FPGA 是否會(huì)取代 CPU?
FPGA 的性能越來(lái)越強(qiáng)大,應(yīng)用范圍也在不斷擴(kuò)展,可能會(huì)有人問(wèn),在未來(lái) FPGA 能否取代通用 CPU 或者脫離 CPU 獨(dú)立運(yùn)行? Salil Raje 指出,“在云以外的一些應(yīng)用 FPGA 可以取代 CPU,但是如果在云上,F(xiàn)PGA 更多被視為一種協(xié)處理器,可以減少 CPU 的數(shù)量。在配置方面,一個(gè) CPU 加八個(gè)、十個(gè) FPGA,它們相互可以交流,從而減少 CPU 的數(shù)量,但是主機(jī)還是 CPU。FPGA 在其它應(yīng)用當(dāng)中完全獨(dú)立于 CPU 運(yùn)行,比如很多最終使用場(chǎng)景,如監(jiān)測(cè)攝象頭就不需要額外的 CPU,因?yàn)樵?Xilinx 的方案中既有 FPGA 又集成了 ARM 架構(gòu)的 CPU,。還有一些無(wú)線通信無(wú)線通信只需要 FPGA,不需要 CPU?!?/p>

在大會(huì)現(xiàn)場(chǎng),我們還看到了賽靈思的合作伙伴展出的產(chǎn)品及演示。


深鑒科技:基于賽靈思深度學(xué)習(xí)和語(yǔ)音加速方案

隨著微信、微博的發(fā)展,視頻內(nèi)容大量產(chǎn)生,而大部分是無(wú)效信息,而且視頻內(nèi)容處理起來(lái)非常復(fù)雜,深鑒科技選擇在模型上刪除不重要的部分,使模型更小但效果更高,模型變小之后再進(jìn)行壓縮提高效率;隨后使用一個(gè)訓(xùn)練模型,這個(gè)模型采用低精度的數(shù)據(jù),在計(jì)算的時(shí)候速度更快。在研發(fā)過(guò)程中,深鑒科技發(fā)現(xiàn) FPGA 比 GPU 快 10 倍,比 CPU 快 30 到 40 倍。而且 FPGA 延時(shí)非常低,這對(duì)于以推測(cè)為基礎(chǔ)的機(jī)器學(xué)習(xí)來(lái)說(shuō)非常重要,而且 FPGA 非常靈活,可以適用不同的機(jī)器學(xué)習(xí)的應(yīng)用模型。


華為云 FP1 高性能實(shí)例演示

華為的這一實(shí)例展現(xiàn)了 Gzip 壓縮算法,左邊是經(jīng)過(guò) FPGA 加速的壓縮處理過(guò)程,右邊是通過(guò) CPU 視頻處理的過(guò)程,可以看出左側(cè)的壓縮速度遠(yuǎn)遠(yuǎn)快于右側(cè),可見(jiàn) FPGA 加速方案性能相對(duì)于 CPU 有近 4 倍的提升,動(dòng)態(tài)邏輯加載和切換實(shí)現(xiàn)秒級(jí)完成。

與非網(wǎng)原創(chuàng)報(bào)道,未經(jīng)允許,不得轉(zhuǎn)載!

更多相關(guān)內(nèi)容,請(qǐng)參照:與非網(wǎng) FPGA 專(zhuān)區(qū)。

亞馬遜

亞馬遜

亞馬遜公司(Amazon,簡(jiǎn)稱亞馬遜;NASDAQ:AMZN),是美國(guó)最大的一家網(wǎng)絡(luò)電子商務(wù)公司,位于華盛頓州的西雅圖。是網(wǎng)絡(luò)上最早開(kāi)始經(jīng)營(yíng)電子商務(wù)的公司之一,亞馬遜成立于1994年,一開(kāi)始只經(jīng)營(yíng)網(wǎng)絡(luò)的書(shū)籍銷(xiāo)售業(yè)務(wù),現(xiàn)在則擴(kuò)及了范圍相當(dāng)廣的其他產(chǎn)品,已成為全球商品品種最多的網(wǎng)上零售商和全球第二大互聯(lián)網(wǎng)企業(yè),在公司名下,也包括了AlexaInternet、a9、lab126、和互聯(lián)網(wǎng)電影數(shù)據(jù)庫(kù)(Internet Movie Database,IMDB)等子公司。

亞馬遜公司(Amazon,簡(jiǎn)稱亞馬遜;NASDAQ:AMZN),是美國(guó)最大的一家網(wǎng)絡(luò)電子商務(wù)公司,位于華盛頓州的西雅圖。是網(wǎng)絡(luò)上最早開(kāi)始經(jīng)營(yíng)電子商務(wù)的公司之一,亞馬遜成立于1994年,一開(kāi)始只經(jīng)營(yíng)網(wǎng)絡(luò)的書(shū)籍銷(xiāo)售業(yè)務(wù),現(xiàn)在則擴(kuò)及了范圍相當(dāng)廣的其他產(chǎn)品,已成為全球商品品種最多的網(wǎng)上零售商和全球第二大互聯(lián)網(wǎng)企業(yè),在公司名下,也包括了AlexaInternet、a9、lab126、和互聯(lián)網(wǎng)電影數(shù)據(jù)庫(kù)(Internet Movie Database,IMDB)等子公司。收起

查看更多

相關(guān)推薦