過去的一年,國內AI產業(yè)面臨巨大挑戰(zhàn),大算力AI芯片和板卡被“卡”,AI芯片軟件生態(tài)也面臨巨大困難。業(yè)界普遍認為,除了美國英偉達等產品外,使用其他產品進行大模型開發(fā)難度極大。
這種形勢其實也反映了市場需求的大幅增長和技術進步的迫切需求。大模型尤其是多模態(tài)大模型的出現,正在將AI帶到更多領域,對AI技術發(fā)展起到巨大的推動作用。
近期,英偉達“中國特供版”芯片遇冷的局面,也給國產AI芯片帶來更大的想象空間。國產AI芯片是否有望開啟新格局、并深遠影響AI技術的發(fā)展?<與非網>對話AI明星企業(yè),探尋產業(yè)的關鍵動力和發(fā)展趨勢。
Imagination:AI SoC設計靈活性是關鍵
過去幾年,Transformer已經取代傳統(tǒng)卷積神經網絡成為AI的首選,這在硬件方面產生了重大影響,尤其是對那些通常只針對少數算法優(yōu)化進行定制的AI加速器。
這給硬件設計師帶來了挑戰(zhàn),他們往往希望能夠面向未來工作負載繼續(xù)進行優(yōu)化。這在產品生命周期較長的市場中尤其明顯,例如在汽車行業(yè),隨著車輛連接性的增強,汽車甚至可以在車載SoC設計后十年內接收軟件更新。
Imagination副總裁、中國區(qū)總經理劉國軍認為,“鑒于AI軟件的持續(xù)進化,將設計靈活性整合到SoC中可能比僅專注于固定功能性能更為理想?!?/p>
Imagination副總裁、中國區(qū)總經理 劉國軍
行業(yè)呼喚芯片架構突破“三角束縛”
后摩智能聯合創(chuàng)始人項之初談到,如何讓大模型更廣泛落地,形成商業(yè)閉環(huán),為大眾帶來經濟價值和福祉,是需要進一步探索的。從支撐大模型底層的算力芯片角度看,目前并沒有找到特別好的方案,能夠在性能、功耗、成本等方面都能滿足大模型在更廣泛場景的落地需求。
“顯然不能到處去部署大幾百瓦、幾萬美元一顆的GPU。所以我們需要更創(chuàng)新的芯片架構,去突破馮諾依曼架構對算力、功耗、成本這個不可能三角的束縛”,項之初表示。
后摩智能聯合創(chuàng)始人 項之初
大模型不是“萬金油”,算力是關鍵
鯤云科技合伙人、COO王少軍博士認為,2023年,國產大模型爆發(fā)式增長,但真正實現產業(yè)落地還需要時間。目前,許多行業(yè)仍然主要使用傳統(tǒng)的深度學習方法,如CV和NLP類算法。而新應用場景更加具體化,AI技術需要與具體業(yè)務需求結合得更緊密。
他指出,AI企業(yè)不僅需要具備技術能力,還要與各行業(yè)合作,深入了解業(yè)務場景,才能真正發(fā)揮AI技術的實際作用。
在AI的發(fā)展過程中,如何將產品落地到實際場景一直是一個挑戰(zhàn),大模型能否改變這一現狀?王少軍表示,對于常規(guī)場景,大模型有望解決這一問題,但對于一些長尾、稀缺場景,大模型仍存在局限性。在他看來,算力才是大模型時代最基礎、優(yōu)先級最高的問題,如果沒有足夠的算力,其他技術得以有效應用的基礎也不存在。
鯤云科技合伙人、COO 王少軍博士
全面突圍:多元芯片架構+軟硬件生態(tài)
AI芯片競爭日趨激烈,而沿用原有技術路線、依靠先進工藝來提升芯片性能,不論是從技術發(fā)展角度、還是在當前的國際背景下,都變得越來越難。
“單純依賴芯片工藝并不能確保產業(yè)的持久發(fā)展,在國內可控工藝條件下,通過架構創(chuàng)新來實現性能更優(yōu)、性價比更高的芯片,應該是國內大多數芯片公司努力的方向”,王少軍談到,“只有當產品性價比足夠高,滿足市場競爭需求時,行業(yè)才算真正做好,從業(yè)者的能力才算真正提升。當前,產業(yè)界應該積極探索底層技術創(chuàng)新和產業(yè)發(fā)展的新路徑。數據流架構就是一個備受關注的方向,國內外一些大型公司也在致力于可重構數據流的研究。這個方向具有廣泛的應用場景,適用于云、邊、端各種場景?!?/p>
除了數據流架構,存算一體AI芯片架構也被認為有潛力承擔大模型時代的底層算力支撐。項之初表示,“存算一體作為一種新的芯片架構,需要資本、人才和社會資源的共同投入,促進研發(fā)和落地,同時也需要更多的應用機會進行迭代。”
劉國軍認為,隨著邊緣AI無處不在,對于那些要求快速響應、高度安全或在網絡連接不穩(wěn)定的情況下運行的應用,直接在設備上處理AI工作負載的能力變得至關重要。并且,賦予AI芯片設計靈活性至關重要,特別是在邊緣設備有限的面積、內存和功耗條件下。他介紹,Imagination GPU IP能以高性能和高效率處理計算工作負載,而且支持包括OpenCL在內的常用API,具備高度可編程性。通過持續(xù)投資軟件領域,包括工具、庫、模型和驅動程序等,希望提供最優(yōu)的計算編程環(huán)境。“人工智能的普及預計將主導半導體行業(yè)及Imagination未來的業(yè)務發(fā)展”,他補充道。
行業(yè)或將洗牌,大模型持續(xù)進化
千芯科技董事長陳巍認為,大模型主要有以下四大趨勢:首先,大模型還會進一步進化。從目前看來,Transformer結構雖好,但對于超長token生成時,算力資源呈幾何級數增長,對于編程等長文的自動生成并不友好。有較大概率會有新的結構替代,或者Transformer自己進化,形成新一代的大模型基礎結構。
千芯科技董事長 陳巍
第二,多模態(tài)大模型和混合專家(MoE)模型會逐漸成為新的主流模型。目前文本模態(tài)的大模型是主流,但隨著技術的進步,多模態(tài)大模型會提供更多的功能、落地應用。另外大模型的主體會逐漸演變到MoE模式,而這兩者都會對算力有更高要求。
第三,大模型逐漸具備自學習能力。目前的大模型訓練還是離線的,這使得模型訓練后就固化,難以隨著應用場景自動適應。預估1-2年,自適應學習的大模型會逐漸進入應用領域,更好地服務人類社會。
第四,CUDA生態(tài)有一定概率被其他開源生態(tài)取代。目前來看,CUDA生態(tài)是主流,但由于CUDA編程模型本身是以緩存為中心的,與目前大模型的分層結構有一定的調度矛盾。從這個角度看,現有的CUDA生態(tài)也是大模型算力發(fā)展的障礙。隨著微軟、Google、特斯拉等巨頭自研大模型芯片的進度加快,預計這些巨頭也會協力推動新的并行硬件編程生態(tài)。
王少軍則從算力和大模型角度提出兩大值得關注的方向:一是推理的重要性,隨著大模型應用在更多場景,推理將成為關鍵,需要關注推理芯片的計算訴求和系統(tǒng)要求,以降低成本并提高易用性,從而推動大模型在行業(yè)中的快速落地。二是大模型輕量化的趨勢,大模型走向輕量化、并且在邊緣和終端進行部署,將成為值得關注的領域。
2023年10月,工業(yè)和信息化部等六部門印發(fā)了《算力基礎設施高質量發(fā)展行動計劃》,要求到2025年國內算力達到300EFLOPS。其中,不僅包括云端算力,也強調了邊緣算力的協同發(fā)展?!斑@對于國產AI芯片企業(yè)來說是一個積極的信號,意味著存在巨大的市場和豐富的應用場景。對于從業(yè)者來說,每個人都有機會在這個市場中分得一杯羹,為整個行業(yè)帶來利好”, 王少軍表示。
項之初認為,雖然國內AI產業(yè)目前是被客觀因素限制的狀態(tài),并沒有完全展示出應有的潛力。但總體上看,因為龐大的應用場景和數據量,還是會讓中國成為全球唯二的AI產業(yè)市場,這個預期將會長期存在??傮w上,大模型的下沉、在更多垂直領域的落地,將會給行業(yè)帶來新的增長契機,比如Transformer上車對自動駕駛的意義等趨勢都值得關注。
當然,AI芯片未來一兩年還是會有很多挑戰(zhàn),比如資本市場過山車般的態(tài)度轉變,會讓很多暫時沒實現融資、前期擴張又過于激進的公司陷入困境。
“但硬幣總有另外一面,市場態(tài)度的轉冷,能夠讓芯片人才安靜下來,而不是頻繁跳槽抬高短期收入,這對行業(yè)的健康發(fā)展,對有長期價值的公司反而是好事”,項之初補充。
寫在最后
自去年10月,美國發(fā)布新規(guī)阻止英偉達向中國出售尖端AI芯片以來,英偉達陸續(xù)推出幾款“特供”芯片,以便在合規(guī)情況下繼續(xù)在中國的生意。
不過,幾家頭部云廠商近期表明,訂購的芯片數量遠遠少于原計劃購買的已被禁的高性能芯片。知情人士稱,一方面,這些云廠商將先進半導體訂單轉移給了本土芯片公司;另一方面,他們也在更多依賴公司內部開發(fā)的芯片。
短期來看,國產AI芯片與英偉達降級版芯片的性能差距在縮小,但論及中美芯片局勢實現逆轉還為時過早。正如幾位受訪人所指出,AI當前面臨的形勢是極其復雜的,既需要底層技術的根本變革,也需要軟硬件生態(tài)、上下游供應鏈的合力發(fā)展,同時,也要充分看到AI大模型的發(fā)展方向,下沉到邊緣、端側是必然方向,也將給多元算力發(fā)展帶來全新機遇。