IBM 公司在 21 世紀早期引進了 Watson,從而進入了人工智能現(xiàn)在的周期,并且從那時候開始在不斷加大力度。最近,IBM 發(fā)布了 PowerAI,IBM 的軟件工具包解決方案與 OpenPower 系統(tǒng)配合使用,針對那些不想完全從頭開始開發(fā)自己的 AI 解決方案,但是仍然希望定制滿足自己特定深度學習需求的企業(yè)。如今,IBM Research 公布了一項新突破,這將只會進一步加強 PowerAI 和其它的 AI 產(chǎn)品,這是一個在過去六個月中我所看到的突破性的分布式深度學習軟件。
擺脫單點瓶頸
所有一直關注人工智能的人都知道,深度學習在近幾年才真正發(fā)展起來。它為商業(yè)領域和消費者的百個應用程序提供支持,并且在持續(xù)增加。然而,阻礙深度學習進一步激增的最大問題之一是可擴展性問題?,F(xiàn)在大多數(shù) AI 服務器只是一個單一的系統(tǒng),而不是多個系統(tǒng)的組合。最流行的開源深度學習軟件框架在多個服務器上表現(xiàn)不佳,造成了一個耗時的瓶頸。換句話說,盡管許多數(shù)據(jù)科學家已經(jīng)可以訪問 4 到 8 個 GPU 服務器,他們不能利用它擴展到單個節(jié)點之外,到目前為止,這個軟件并不是為此而設計的。
輸入 IBM DDL 庫:這個庫使用 IBM Research 的獨特集群方式構建,連接到領先的開源 AI 框架(如:TensorFlow, Caffee, Torch, 和 Chainer)。通過 DDL,這些框架能擴展到數(shù)十臺 IBM 服務器,利用數(shù)百個 GPU—一種舊的晝夜不同的處理模型。為了描繪一張照片,當 IBM 最初試圖用 ImageNet-22K 數(shù)據(jù)集來訓練一個模型時,使用 ResNet-101 模型,在一臺 Power “Minsky” 服務器上,加上 4 臺英偉達 P100 GPU 加速器,花費 16 天。16 天的訓練意味著大大延遲了洞察力,以及嚴重阻礙生產(chǎn)力。
IBM 稱 DDL 為“深度學習的噴氣式引擎”—一個吸引人的名字,確實不太離譜。IBM 表示,使用 DDL 技術,能夠在 64 臺 Power “Minsky”服務器上,一共 256 個英偉達的 P100GPU,將相同的流程縮減到 7 個小時。讓我重申一下:16 天縮減到 7 個小時。如果這些結果精確的話,那么為什么 IBM 認為它可以真正的改變游戲規(guī)則?在 7 個小時內(nèi),IBM 的新的圖像識別準確度 33.8%的記錄,超過了微軟在業(yè)界創(chuàng)立的 10 天精確度 29.9%的記錄。為了完成這一切,IBM 表示,DDL 可以高效擴展,上升到 256 個 GPU,Caffe 深度學習框架的效率提升到 95%。
測試版已經(jīng)上線
開發(fā)者不用非要等到嘗試這項新技術。IBM research 正在為 IBM 系統(tǒng)提供一個 DDL 測試版,IBM 系統(tǒng)現(xiàn)在已經(jīng)發(fā)布了新版本 IBM PowerAI (TensorFlow 和 Caffe, Torch 和 Chainer 即將推出)的第四個版本。我認為這將是 IBM 電源系統(tǒng)的一個重要的補充,他被稱作“瑞士軍刀加速器”—標準 PCI Express、CAPI 和 NVLink 標準,都被封裝在一個平臺上。
關于 DDL,另外一個需要特別注意的是,它將不僅可以在本地使用,還可以在云端使用—通過云端服務商 Nimbix 提供。今天的異構環(huán)境,靈活性是顯而易見的。開發(fā)者能夠在 Nimbix 者在 IBM Power 系統(tǒng)服務器上,使用測試版本。
總結
很有意思的事情是,這項新技術是來自于 IBM,而不是其它如谷歌或者 Facebook,這樣更大更響亮的 AI 組件支持者。看起來,IBM 能夠繼續(xù)攜“第一”到桌面上,IBM 不僅是企業(yè)領的主要參與者,還在深度學習領域也是。DDL 和 OpenPOWER 是秘密資源—我相信未來將給 IBM 所需要的結果—大大縮短訓練時間,提高精確度和效率。我認為消除了瓶頸,DDL 有潛力去實現(xiàn)打開深度學習的門閘。這對 IBM、PowerAI 和 OpenPOWER 是真正改變游戲規(guī)則。
與非網(wǎng)編譯內(nèi)容,未經(jīng)允許,不得轉(zhuǎn)載!