作者 |??徐豫,編輯?|??漠影
這個(gè)AI領(lǐng)域千億級(jí)市場(chǎng),將輻射千家萬(wàn)戶。
DeepSeek-R1橫空出世,打響了大模型比拼性價(jià)比的第一槍。Meta、OpenAI等國(guó)外頭部大模型廠商紛紛復(fù)刻或變相降價(jià)。比DeepSeek-R1晚兩周發(fā)布的OpenAI o3-mini模型,定價(jià)比前代模型o1-mini降低了超6成,比前代完整版的o1模型便宜超9成。國(guó)內(nèi)的大模型廠商也迅速做出反應(yīng)。
2月13日,百度宣布文心一言將于4月1日全面免費(fèi)開放。文心一言此前采取基礎(chǔ)版免費(fèi)、專業(yè)版收費(fèi)的模式,專業(yè)版定價(jià)59.9元/月,連續(xù)包月優(yōu)惠價(jià)49.9元/月。這場(chǎng)看似僅僅是價(jià)格層面的競(jìng)爭(zhēng),實(shí)則背后蘊(yùn)含著更為深層次的較量,其不僅是技術(shù)實(shí)力的比拼,也是對(duì)用戶市場(chǎng)的爭(zhēng)奪。
在這場(chǎng)沒有硝煙的商戰(zhàn)中,中國(guó)算力市場(chǎng)正經(jīng)歷著深刻的變革。最近發(fā)布的《2025年中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》(以下簡(jiǎn)稱《報(bào)告》),把中國(guó)算力發(fā)展的四大變化,從“幕后”搬到了“臺(tái)前”。
01.算力效率之變:大模型從“大力出奇跡”,轉(zhuǎn)向“四兩撥千斤”
第一大變化體現(xiàn)在算力效率方面,DeepSeek通過算法優(yōu)化,大幅降低大模型訓(xùn)練、推理對(duì)高端GPU的依賴,突破了“算力軍備競(jìng)賽”的傳統(tǒng)路徑?。模算效率的顯著提升,正是DeepSeek能夠?qū)崿F(xiàn)高性價(jià)比的核心因素之一。
DeepSeek的論文顯示,DeepSeek-R1訓(xùn)練成本僅557萬(wàn)美元,不足OpenAI同類產(chǎn)品的5%,卻能在數(shù)學(xué)競(jìng)賽、代碼生成等任務(wù)中超越GPT-4模型。這意味著DeepSeek-R1以較低的算力成本投入,也能實(shí)現(xiàn)高性能產(chǎn)出,即模算效率較高。這其中的模算效率(Model Computation Efficiency)就是,AI模型的訓(xùn)練和推理過程中用來衡量模型精度與計(jì)算資源利用效率的綜合指標(biāo),它反映了模型在特定硬件平臺(tái)上,以最小的算力消耗實(shí)現(xiàn)最高精度的能力。DeepSeek“四兩撥千斤”的研發(fā)模式,更加注重算法創(chuàng)新、架構(gòu)優(yōu)化和資源的高效利用,這或許將帶動(dòng)業(yè)界對(duì)于模算效率的追求。
IDC中國(guó)副總裁周震剛接受采訪時(shí)稱,未來,大模型廠商們的關(guān)注點(diǎn)將從追求參數(shù)量規(guī)模,轉(zhuǎn)變?yōu)樽非竽P陀?xùn)練、推理、部署等環(huán)節(jié)的性價(jià)比。此外,DeepSeek使用MoE(混合專家模型)架構(gòu)實(shí)現(xiàn)了更高的成本效益,而Dense架構(gòu)在相同參數(shù)量下擴(kuò)展的計(jì)算成本較高。
浪潮信息高級(jí)副總裁劉軍在接受采訪時(shí)回顧:“去年開始,大家發(fā)現(xiàn)基于Dense架構(gòu)的模型,再往前去演化到要訓(xùn)練一個(gè)超過五千億、一萬(wàn)億參數(shù)量的模型時(shí),所需的算力、時(shí)間、數(shù)據(jù)量,都是當(dāng)前技術(shù)條件下實(shí)現(xiàn)不了的。有企業(yè)做過一個(gè)評(píng)估,在這種情況下,需要20萬(wàn)張卡訓(xùn)練一年,才能把一個(gè)萬(wàn)億的Dense模型高質(zhì)量訓(xùn)練出來?!币虼耍琈oE展現(xiàn)出來的在計(jì)算成本、模型性能等方面的優(yōu)勢(shì),或?qū)⒁l(fā)業(yè)界對(duì)于該架構(gòu)的一波模仿借鑒。
當(dāng)下,企業(yè)接入DeepSeek模型主要有兩種策略。一方面,國(guó)內(nèi)大模型廠商、芯片廠商、AI硬件廠商、運(yùn)營(yíng)商、AI應(yīng)用開發(fā)商等相繼接入DeepSeek模型671B滿血版;另一方面,有的企業(yè)會(huì)根據(jù)自身業(yè)務(wù)需求選擇接入DeepSeek參數(shù)量較小的模型,或者選擇蒸餾DeepSeek模型將其與自家模型相結(jié)合,從而提高模型性能、降低應(yīng)用成本。這種多形態(tài)、多參數(shù)的模型協(xié)同發(fā)展,才是大模型生態(tài)應(yīng)有的狀態(tài)。在浪潮信息高級(jí)副總裁劉軍看來,把DeepSeek-R1模型的能力蒸餾到一些小模型上,實(shí)際會(huì)促進(jìn)AI技術(shù)的擴(kuò)散。
02.算力結(jié)構(gòu)之變:智能算力市場(chǎng)井噴,推理算力成“香餑餑”
將目光放到整個(gè)算力市場(chǎng),我們可以發(fā)現(xiàn)第二大變化,國(guó)內(nèi)智能算力規(guī)模正極速擴(kuò)張,需求結(jié)構(gòu)也正被重塑?!秷?bào)告》顯示,2024年中國(guó)智能算力規(guī)模達(dá)725.3EFLOPS,同比增長(zhǎng)74.1%,是近5年來的總量最高峰。這也是近年來中國(guó)智能算力規(guī)模擴(kuò)張速度最快的一次。相比于國(guó)內(nèi)通用算力,智能算力的增幅已經(jīng)達(dá)到同期通用算力增幅的3倍以上。2024年中國(guó)通用算力規(guī)模為71.5EFLOPS,同比增長(zhǎng)20.6%。
這意味著,過去一年內(nèi),AI芯片、AI服務(wù)器、AI訓(xùn)練、AI推理和AI應(yīng)用的市場(chǎng)規(guī)模也在快速膨脹。例如,2024年中國(guó)AI加速計(jì)算服務(wù)器市場(chǎng)規(guī)模為190億美元,同比大幅增長(zhǎng)86.9%。盡管此前業(yè)界對(duì)大模型的Scaling law(規(guī)模法則)是否失效有所爭(zhēng)議,但在當(dāng)下的AI發(fā)展進(jìn)程中,其仍占主導(dǎo)地位。這也是推動(dòng)AI算力需求持續(xù)增長(zhǎng)的主要原因之一?!秷?bào)告》中提到,基于杰文斯悖論的現(xiàn)象反映出,DeepSeek實(shí)現(xiàn)的算法效率提升,并未抑制算力需求,反而帶動(dòng)了更多的用戶和場(chǎng)景,進(jìn)一步推動(dòng)了大模型的普及與應(yīng)用落地。這也有助于AI行業(yè)重構(gòu)產(chǎn)業(yè)創(chuàng)新范式,并加強(qiáng)數(shù)據(jù)中心、邊緣及端側(cè)算力建設(shè)。
不過,單單堆疊訓(xùn)練算力的策略并不能一勞永逸。越來越多大模型廠商轉(zhuǎn)向加速開發(fā)大模型的多模態(tài)能力,并尋找落地場(chǎng)景。多模態(tài)模型的應(yīng)用、AI Agent熱潮隨之出現(xiàn),并且知識(shí)管理、對(duì)話式應(yīng)用、內(nèi)容生成、營(yíng)銷、視頻生成等都成為了生成式AI技術(shù)的熱門落地場(chǎng)景。
在應(yīng)用落地側(cè),這會(huì)大幅激發(fā)AI推理需求。如聊天機(jī)器人、音視頻圖像等的生成、辦公場(chǎng)景的AI助手等,在實(shí)際的應(yīng)用場(chǎng)景中都較為依賴AI推理能力。因此,《報(bào)告》中預(yù)測(cè),后續(xù)用于推理的算力規(guī)模,將會(huì)超過用于訓(xùn)練的算力規(guī)模。在全球AI服務(wù)器市場(chǎng)中,未來生成式AI服務(wù)器的占比,將從2025年的29.6%,提升至2028年的37.7%。
在真實(shí)的業(yè)務(wù)場(chǎng)景中實(shí)現(xiàn)“降本增效”是AI技術(shù)發(fā)展的重要一環(huán)。未來,隨著大模型相關(guān)技術(shù)逐漸成熟,以及生成式AI應(yīng)用不斷拓展,推理場(chǎng)景的需求日益增加,推理服務(wù)器的占比將大幅提高。IDC的數(shù)據(jù)顯示,預(yù)計(jì)到2028年,推理工作負(fù)載占比將會(huì)達(dá)到73%。
這一發(fā)展趨勢(shì)也在浪潮信息的業(yè)務(wù)中得到了印證。據(jù)浪潮信息高級(jí)副總裁劉軍透露,近期公司接到的大部分都是推理算力的訂單,現(xiàn)階段推理算力的投資回報(bào)率高,帶來的用戶體驗(yàn)也更好,所以推理算力的規(guī)模會(huì)大幅提升。
03.算力供應(yīng)方式之變:算力供應(yīng)方式多元化,企業(yè)AI選擇更多了
第三大變化來自算力供應(yīng)的方式。蛋糕做大了,下場(chǎng)分蛋糕的人也多了。去年有一大很明顯的市場(chǎng)趨勢(shì)是,一方面,AI算力基礎(chǔ)設(shè)施的供給結(jié)構(gòu)趨于多元化,另一方面,用戶對(duì)智能算力基礎(chǔ)設(shè)施和服務(wù)能力的需求,也在發(fā)生深刻變化。
在供給端,其形成了數(shù)據(jù)中心服務(wù)商、云服務(wù)商、硬件廠商和相關(guān)AI創(chuàng)企多點(diǎn)提供AI算力資源的格局。在需求端的變化則集中于兩點(diǎn):首先,生成式AI將進(jìn)一步推動(dòng)企業(yè),使用AI就緒的數(shù)據(jù)中心托管設(shè)施、生成式AI服務(wù)器集群等智算服務(wù),這可以幫助企業(yè)縮短部署時(shí)間,降低資本成本。IDC數(shù)據(jù)顯示,2024年中國(guó)智算服務(wù)市場(chǎng)整體規(guī)模達(dá)到50億美元;其預(yù)計(jì)2025年中國(guó)智算服務(wù)市場(chǎng)整體規(guī)模將達(dá)到79.5億美元,2028年達(dá)到266.9億美元,2023年至2028年的年復(fù)合增長(zhǎng)率將達(dá)到57.3%。
其次,用于推理的一體機(jī)也開始受到市場(chǎng)追捧。IDC中國(guó)副總裁周震剛解釋說,早前企業(yè)基于云服務(wù)部署AI的案例比較多,而用一體機(jī)的比較少。但是DeepSeek模型爆火后,企業(yè)對(duì)于一體機(jī)的需求隨之大幅上升,開始注重私有化部署。因此,后續(xù)一段時(shí)間內(nèi),“開源+一體機(jī)”可能會(huì)成為企業(yè)AI服務(wù)的爆款模式。據(jù)不完全統(tǒng)計(jì),目前市面上至少已有60家DeepSeek一體機(jī)企業(yè),其中既有京東云、移動(dòng)云、聯(lián)通云等云服務(wù)提供商,也有聯(lián)想、華為等大廠。
基于一體機(jī),企業(yè)便可以通過“開箱即用”的方式,快速接入更強(qiáng)大的AI能力。浪潮信息上周推出的元腦R1推理服務(wù)器,就是其中一員。浪潮信息方面稱,該產(chǎn)品通過系統(tǒng)創(chuàng)新和軟硬協(xié)同優(yōu)化,單機(jī)即可部署運(yùn)行DeepSeek-R1滿血版671B的模型。據(jù)浪潮信息高級(jí)副總裁劉軍透露,“最近兩個(gè)禮拜,來找我們咨詢購(gòu)買能帶動(dòng)滿血版DeepSeek-R1模型的AI服務(wù)器的客戶數(shù),正直線上升?!?/p>
04.城市AI排名之變:京杭滬拿下AI算力全國(guó)前三
第四大變化是城市AI算力排名?!秷?bào)告》的數(shù)據(jù)顯示,目前國(guó)內(nèi)各城市正通過加大AI投資、吸納人才以及提供政策支持等舉措,持續(xù)為AI發(fā)展提升競(jìng)爭(zhēng)優(yōu)勢(shì)。可以看到,在中國(guó)各城市的AI算力排行榜中,北京和杭州依然穩(wěn)居排行榜前兩位,上海的排名則從2023年的第四位上升至第三位。這3座城市的AI策略各有所側(cè)重。其中,北京聚集了一大批大模型企業(yè),憑借大量人才、成熟的企業(yè)和有力的政策扶持,持續(xù)位居首位。杭州早在2021年就提出要成為具有全球影響力的AI頭雁城市,并頒布了諸多政策支持AI發(fā)展;上海的優(yōu)勢(shì)在于,其正加速推動(dòng)AI世界級(jí)產(chǎn)業(yè)集群建設(shè)等工作,并表現(xiàn)出色。此外,廣州、成都、天津、廈門等城市的AI算力全國(guó)排名均有所提升。
AI影響下,不同行業(yè)的AI應(yīng)用滲透度排名也發(fā)生了變化。排名第一的是互聯(lián)網(wǎng)行業(yè),其AI相關(guān)應(yīng)用的滲透率更高。在該行業(yè)中,AI原生應(yīng)用已覆蓋問答、寫作、客服、路線規(guī)劃、生活指導(dǎo)、學(xué)習(xí)助手、角色扮演、視頻生產(chǎn)、圖片企業(yè)智能客服、智能銷售分析等多個(gè)場(chǎng)景。金融行業(yè)從2023年的第四名,上升至2024年的第二名。制造行業(yè)2024年的排名相較于2023年前進(jìn)了一位。這是由于金融行業(yè)積累了海量的數(shù)據(jù),可以用于AI訓(xùn)練,為其進(jìn)行風(fēng)險(xiǎn)評(píng)估等提供決策依據(jù);在制造業(yè)方面,由AI驅(qū)動(dòng)的機(jī)器人和自動(dòng)化設(shè)備可以完成重復(fù)性高、勞動(dòng)強(qiáng)度大的工作任務(wù)。
05.結(jié)語(yǔ):未來算力發(fā)展既要“擴(kuò)容”,也要“提效”
從這四大變化可以看出,國(guó)內(nèi)算力產(chǎn)業(yè)的發(fā)展正呈現(xiàn)出蓬勃向上的態(tài)勢(shì)。與此同時(shí),更為迫切的算力發(fā)展挑戰(zhàn)也被擺到了算力提供商面前。未來,如何持續(xù)優(yōu)化計(jì)算架構(gòu),如何進(jìn)一步提升智算中心的算力資源利用率,如何完善數(shù)據(jù)中心的監(jiān)控系統(tǒng)和故障恢復(fù)機(jī)制,都亟需新的解決方案。
針對(duì)此,《報(bào)告》也提出了解決辦法,那就是算力提供商可以根據(jù)自身情況,采用算力“擴(kuò)容”和“提效”并行策略來部署AI算力。其中,擴(kuò)容包括增加智算中心的數(shù)量和種類,注重智算中心建設(shè)的區(qū)域分布和技術(shù)先進(jìn)性,以加強(qiáng)算力供給能力。提效包括以用定建,以應(yīng)用為導(dǎo)向規(guī)劃AI基礎(chǔ)設(shè)施;提高模型架構(gòu)效率;優(yōu)化算力基礎(chǔ)設(shè)施架構(gòu),包括計(jì)算架構(gòu)、內(nèi)存層次架構(gòu)、智能調(diào)度算法等;使用高質(zhì)量的數(shù)據(jù)集,并搭建統(tǒng)一的數(shù)據(jù)存儲(chǔ)和訪問接口,以提高算力利用率。
未來,大模型產(chǎn)業(yè)的底層技術(shù)創(chuàng)新加速、場(chǎng)景應(yīng)用逐漸鋪開,都將為國(guó)內(nèi)算力市場(chǎng)注入新活力。