AI Infra行業(yè)分享會:與澎峰科技一起開啟算力時代

03/18 11:44 來源:唯快資本
1464
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

本次活動于2025年3月15日舉辦,采用線上+線下的方式,研討主題為:AI Infra賽道。本次分享會得到了來自于深合投資、毅嶺資本、碧鴻投資等機構的廣大投資人的熱情參與和探討。后續(xù)我們將持續(xù)進行其他主題的行業(yè)分享會,如有意愿參與分享的企業(yè)和嘉賓,可聯(lián)系我們報名參與。

分享企業(yè)簡介——澎峰科技

澎峰科技是一家以“軟件定義算力”為核心的AI基礎設施領軍企業(yè),核心團隊源自中科院,匯聚了高性能計算與人工智能領域的頂尖專家。公司致力于通過自主研發(fā)的國際領先算力基礎軟件棧,為算力芯片企業(yè)提供加速計算解決方案,通過軟件優(yōu)化釋放硬件潛能,構建從芯片適配到行業(yè)落地的AI全棧能力。作為國產(chǎn)算力生態(tài)的關鍵參與者,公司已攜手海光、華為、中科院等10+芯片企業(yè)及20+智算中心,推動國產(chǎn)AI基礎設施的規(guī)?;瘧茫铀僦悄軙r代的全面到來。

—核心產(chǎn)品—

PerfMPL高性能計算庫:以OpenBLAS為基礎,覆蓋FFT、SPARSE、DNN等計算場景,顯著提升芯片計算性能,適配國產(chǎn)異構算力硬件(如華為昇騰、寒武紀、燧原等)。PerfXAPI異構計算平臺:提供統(tǒng)一API接口,支持跨架構硬件(CPU/GPU/NPU)的快速開發(fā)與部署,內(nèi)置集成開發(fā)環(huán)境,簡化復雜工作負載管理。PerfXCloud大模型服務平臺:向下兼容主流國產(chǎn)算力與AI框架,向上提供模型推理、微調(diào)、插件生態(tài)等全流程服務,已集成80+大模型,助力企業(yè)及開發(fā)者高效開發(fā)AI應用。

01分享會內(nèi)容概要

AI Infra賽道是生成式人工智能領域的重要組成部分,涵蓋了從算力芯片的研發(fā)到算力運營的全過程。隨著深度學習模型的不斷發(fā)展,尤其是像DeepSeek這樣的模型的出現(xiàn),AI基礎設施的需求和應用正在經(jīng)歷巨大的變革。

AI Infra的定義

  • 算力芯片:包括GPU、FPGA、ASIC等芯片的研發(fā)和生產(chǎn),這些芯片為AI模型提供強大的計算能力。
  • 算力運營:涉及算力中心的建設和運營,確保算力資源的高效分配和使用。
  • 軟硬件協(xié)同:AI模型的訓練和推理不僅依賴于硬件,還需要高效的軟件優(yōu)化,如模型壓縮、分布式計算等技術。

產(chǎn)業(yè)鏈

  • 上游芯片制造國產(chǎn)芯片企業(yè)(如華為、寒武紀等)正在崛起,但在技術上仍與國際領先企業(yè)(如英偉達)存在差距。
  • 中游算力中心:國內(nèi)大量建設算力中心,但存在算力利用率低、適配性差等問題。
  • 下游應用需求:AI應用(如大模型、智能助手等)的爆發(fā)式增長,推動了對算力的巨大需求。

現(xiàn)狀與未來

  • 單純的算力規(guī)模并不能滿足需求,關鍵在于如何提高算力效率,即“有效算力”的重要性日益顯現(xiàn)。算力中心建設與實際應用需求之間存在脫節(jié),導致部分算力資源閑置。一方面我們可以看到應用場景的多樣化,AI應用正在滲透到內(nèi)容生成、數(shù)據(jù)分析、智能助手等多個領域。另一方面我們也可以注意到許多企業(yè)和組織都在構建自己的AI生態(tài),通過技術優(yōu)化和資源整合,提升算力資源的利用效率。
  • 展望未來, AI Infra的發(fā)展需要芯片、算法、算力中心等多環(huán)節(jié)技術的深度融合,構建高效、安全、可持續(xù)的AI基礎設施,是未來AI技術發(fā)展的關鍵。總之,AI Infra賽道正處于快速發(fā)展和變革之中,技術、產(chǎn)業(yè)鏈和安全將是未來發(fā)展的核心要素。

02研討會問題精選

問:國內(nèi)目前的這些AI Infra企業(yè),如果從長遠的商業(yè)化來看,未來的發(fā)展路徑會是什么樣呢?以及你為什么認為這樣發(fā)展?

答:我認為可以用“向左走、向右走”來總結。

  • 向左走:將軟件算法能力轉化為硬件化、IP化、工具化,服務于國產(chǎn)芯片公司(如華為昇騰、寒武紀等)。例如,通過優(yōu)化模型適配國產(chǎn)硬件,推動軟硬協(xié)同創(chuàng)新。
  • 向右走:直接面向市場提供AI服務,包括綁定國產(chǎn)芯片銷售算力、開發(fā)API接口服務客戶,或為企業(yè)提供定制化算力解決方案。例如,無問芯穹通過私有化部署AI工具鏈降低企業(yè)推理成本。

問:為何企業(yè)需要在這兩個方向中選擇?

答:我認為核心原因是AI產(chǎn)業(yè)鏈的“斷層”現(xiàn)狀:

  • 上游芯片與下游應用脫節(jié):國產(chǎn)芯片(如海光、昆侖芯)的性能尚未完全匹配大模型需求,導致應用層企業(yè)需適配不同硬件架構。
  • 算力效率瓶頸:單純堆砌算力規(guī)模無法解決實際問題,需通過算法優(yōu)化提升“有效算力”。
  • 商業(yè)模式分化:企業(yè)需在技術自研(向左)與商業(yè)化落地(向右)之間平衡投入與收益。

向左走適合適合具備算法積累的企業(yè),通過技術復用降低硬件適配成本,或者叫技術導向型的企業(yè)。風險在于需長期投入研發(fā),短期商業(yè)化效果有限。向右走適合已有客戶資源的企業(yè),通過快速迭代服務搶占市場份額,或者叫市場導向型企業(yè)。風險在于依賴外部算力供應商,議價能力較弱。

從市場來看,向右走(商業(yè)化落地)更受資本青睞,例如提供MASS API服務的初創(chuàng)企業(yè)融資活躍。但我認為長遠來看,向左走(軟硬協(xié)同)將成為核心競爭力,尤其在國產(chǎn)替代背景下,算法與芯片的深度綁定是突破“卡脖子”問題的關鍵。

問:國產(chǎn)AI Infra在生態(tài)與能效上面臨哪些挑戰(zhàn)?

答:生態(tài)碎片化:國產(chǎn)芯片廠商(如華為、寒武紀)的軟件棧與CUDA生態(tài)不兼容,開發(fā)成本高。能效比低:智算中心處理1G數(shù)據(jù)耗電13kW·h,需通過液冷技術、異構計算架構(如16卡GPU集群)提升能效。未來AI生態(tài)的構建需兩者結合,回到前一個問題中,我認為通過左側的技術創(chuàng)新支撐右側的商業(yè)落地,最終形成“算法-芯片-應用”的閉環(huán)。

問:開源生態(tài)對AI Infra發(fā)展有何影響?

答:開源生態(tài)會推動技術普惠,DeepSeek開源的FlashMLA、DeepGEMM等工具鏈,推動大模型訓練效率提升至硬件極限。也可以加強生態(tài)整合,開源社區(qū)加速國產(chǎn)芯片適配,例如驛基于3FS系統(tǒng)構建低成本存儲方案,兼容主流框架。開源可能導致技術同質(zhì)化,風險與機遇并存,同時也為初創(chuàng)企業(yè)提供硬件創(chuàng)新機會(如LPU推理芯片)。

問:AI Infra市場的未來格局會是怎樣的?

答:市場可能呈現(xiàn)“公有主導、私有補充”態(tài)勢,但存在兩大變數(shù):硬件不確定性:國產(chǎn)芯片(如寒武紀)與進口芯片(如英偉達H100)的適配效率影響市場格局,異構計算架構或成主流。應用驅動:若AI應用(如Agent)爆發(fā),可能由應用廠商主導AI Infra需求,倒逼基礎設施升級。

問:創(chuàng)業(yè)公司在AI Infra賽道中如何與大廠競爭?

答:創(chuàng)業(yè)公司需聚焦細分場景與大廠形成差異化競爭。例如,選擇企業(yè)私有化部署場景,通過優(yōu)化模型推理成本(如DeepSeek的千億模型部署方案)切入市場。具體策略我認為可總結為3點。第一,技術專精:即針對特定硬件(如國產(chǎn)芯片)或場景(如端側推理)開發(fā)適配工具鏈,減少算力閑置并提升效率。第二,成本控制:通過模型壓縮、FP8精度計算等技術降低推理成本,例如DeepSeek將千億模型推理成本壓縮至可商用范圍。第三,生態(tài)合作:與芯片廠商(如華為昇騰)或云服務商聯(lián)合開發(fā)訓推一體機,彌補自身硬件短板。

相關推薦