英偉達、高通、特斯拉、Mobileye芯片真實算力大比拼
AI運算最關鍵之處是存儲而非AI處理器本身,AI運算90%的功耗和延遲都來自存儲或者說都來自數據的搬運。90%的工況下,AI處理器都在等待存儲系統(tǒng)搬運數據,而運算系統(tǒng)所需要的時間幾乎是可以忽略的,所以存儲系統(tǒng)的好壞實際決定了真實的算力大小,其中存儲帶寬基本可以等同于存儲系統(tǒng)的好壞,也基本等同真實算力的高低。在Transformer時代,模型參數至少10億以上,模型至少1GB大小,存儲帶寬也決定了能不能運行Transformer。此外,存儲還決定了功耗,根據英特爾的研究表明,AI芯片(加速器)當半導體工藝達到 7nm 時,數據搬運功耗高達 35pJ/bit,占總功耗的63.7%。