作者丨董子博,編輯丨林覺民
2025 年,百度的“天”變了。
“前 Deepseek 時(shí)代”,圈里不少人還悲觀地認(rèn)為,中國沒有模型能跟上 GPT 的腳步,對(duì)百度來說,模型不掉隊(duì),應(yīng)用生態(tài)做起來,就能夠留在牌桌上;
而 Deepseek 一出,風(fēng)云變幻、誰與爭鋒——原本,文心 4.0 在國內(nèi)也算數(shù)得上號(hào)的大模型,在 Deepseek 面前,也不得不甘拜下風(fēng)。
于是,巨大的壓力給到了百度:
發(fā)新模型,必然面臨質(zhì)疑,要被拿去在顯微鏡下和 Deepseek 作比較,在冷眼下遭遇批判;
不發(fā)新模型,百度的技術(shù)實(shí)力更沒了展現(xiàn)的機(jī)會(huì),無端的猜測又會(huì)甚囂塵上,客戶的信心也會(huì)被損傷。
進(jìn)退維谷,百度的選擇,是亮出寶劍,非要試一試自己的成色——即使面臨批評(píng)和貶損,百度也決心放下面子,把自己最新的模型成果展示出來。
放下面子,拼了老命,也死活不下牌桌,百度是怎么想的?
01、文心?4.5?和?X1,百度“死磕”
談戰(zhàn)略之前,先聊點(diǎn)實(shí)著的——百度新發(fā)的文心 4.5 和 X1 好用嗎?
作為百度新一代的原生多模態(tài)大模型,文心 4.5 首先是在多模態(tài)的能力上進(jìn)一步升級(jí)。今天的文心 4.5,不僅可以理解照片、工作圖表、視頻內(nèi)容,準(zhǔn)確摘取靜態(tài)、動(dòng)態(tài)圖像中的細(xì)節(jié)信息;甚至還能理解網(wǎng)絡(luò)笑話、梗圖中的幽默和諷刺,并連貫地完成推理。
當(dāng)大模型能力越來越卷、用戶標(biāo)準(zhǔn)越來越高,模型之間最細(xì)微的差距,就決定了實(shí)際生成結(jié)果在體驗(yàn)上的天差地別——原生和非原生的區(qū)別,也由此顯現(xiàn)。
預(yù)訓(xùn)練階段更深層次的模態(tài)融合、專為跨模態(tài)交互和理解設(shè)計(jì)的模型機(jī)制,都是原生多模態(tài)模型的優(yōu)勢。
3月,李彥宏在人民網(wǎng)上發(fā)表了一篇署名文章,其中就提到了原生與非原生多模態(tài)大模型的區(qū)別——原先,所謂的“多模態(tài)模型”,只是幾個(gè)單模態(tài)模型訓(xùn)練后再進(jìn)行拼接;而原生多模態(tài)大模型,勝在以統(tǒng)一的架構(gòu),去實(shí)現(xiàn)對(duì)復(fù)雜世界的統(tǒng)一理解。
本次發(fā)布的文心 4.5,在原生多模態(tài)的角度,思路與谷歌的 Gemini,Meta 的 Llama 4,OpenAI 的 GPT-4o 一致。
而文心 4.5,則是在多模態(tài)異構(gòu)專家擴(kuò)展技術(shù)上更進(jìn)一步,就如同根據(jù)圖像、視頻、文字等不同領(lǐng)域,給智囊團(tuán)請(qǐng)來了一群術(shù)業(yè)有專攻的“專家”,并且通過一套自適應(yīng)模態(tài)感知損失函數(shù),讓“專家”們可以實(shí)力相當(dāng),也就更能完成協(xié)作,執(zhí)行復(fù)雜跨模態(tài)任務(wù)的處理。
多模態(tài)能力之外,針對(duì)大模型不少老生常談的技術(shù)難關(guān),百度在文心 4.5 也交上了這一期的“答卷”:
面對(duì)長文本處理問題和多輪交互,百度優(yōu)化了 FlashMask 動(dòng)態(tài)注意力掩碼,提高了長序列建模能力和訓(xùn)練效率;
針對(duì)大模型的學(xué)習(xí)效率和幻覺問題,文心 4.5 則繼續(xù)在預(yù)訓(xùn)練數(shù)據(jù)下了苦功夫,通過知識(shí)分級(jí)采樣、數(shù)據(jù)壓縮與融合、稀缺知識(shí)點(diǎn)定向合成等技術(shù),百度將數(shù)據(jù)質(zhì)量大幅提升,模型的質(zhì)量和成本也都得到了保障;
而對(duì)強(qiáng)化學(xué)習(xí)效率至關(guān)重要的后訓(xùn)練(Post-training)技術(shù),文心 4.5 一樣沒落下,通過融合多種評(píng)價(jià)方式,百度將一套自反饋迭代式的后訓(xùn)練技術(shù)用到了大模型的后訓(xùn)練當(dāng)中,將強(qiáng)化學(xué)習(xí)的穩(wěn)定性和魯棒性全面提升,讓模型理解人類意圖的能力更上一層樓。
對(duì)標(biāo) GPT-4.5,文心 4.5 已經(jīng)有了相對(duì)亮眼的成績;而對(duì)標(biāo) GPT-o1 和 Deepseek R1 的文心 X1,也交出了一份不錯(cuò)的答卷。
據(jù)了解,百度文心 X1 采取了遞進(jìn)式的強(qiáng)化學(xué)習(xí)訓(xùn)練方法,并且基于思維鏈和行動(dòng)鏈根據(jù)結(jié)果反饋進(jìn)行了端到端的模型訓(xùn)練,給訓(xùn)練效果增色不少;而 Deepseek 最引人注目的評(píng)估系統(tǒng),百度在文心 X1 上也做了革新,他們建立了一套同意的評(píng)估系統(tǒng),并將多種類型的獎(jiǎng)勵(lì)機(jī)制融合,讓模型的訓(xùn)練獲得了更魯棒的反饋。
一系列的努力之下,相比文心 4.0,X1 的文本創(chuàng)作能力顯然更強(qiáng),也更擅長梳理邏輯、分析復(fù)雜問題、生成觀點(diǎn)、提供情緒價(jià)值——能和用戶聊“思考深的”,也能聊“感情真的”;
而到了多模態(tài)的范疇,文心 X1 也沒丟了系列由來已久的跨模態(tài)能力,在圖片理解的精準(zhǔn)度更上一層樓,還能細(xì)節(jié)識(shí)別圖片是否有 P 圖痕跡,兼具一副火眼金睛。
相比 Deepseek,剛剛面世的文心 X1 測試下來,在文本的創(chuàng)意和個(gè)性化上稍遜一籌。但除了前者所不具備的多模態(tài)能力之外,文心 X1 更大的優(yōu)勢在于“家底厚”——文心大家族支持的“高級(jí)搜索”“文檔問答”“AI繪圖”“TreeMind樹圖”“百度學(xué)術(shù)檢索”等等工具,都能在文心 X1 上用到,讓用戶獲得沉浸的一站式 AI 體驗(yàn)。
在能力上來說,兩款模型在文心 4.0 的基礎(chǔ)上又實(shí)現(xiàn)了一次“飛升”;而在成本上,文心 4.5 和 X1 卻再次“跳水”,依靠芯片、模型、框架等層面的聯(lián)合優(yōu)化,文心 4.5 的推理成本只有 GPT-4.5 的 1%,而 X1 的推理成本也只是 Deepseek R1 的一半左右。
成本優(yōu)勢建立了起來,如何讓用戶更便宜地把大模型用起來,百度就有了底氣:
今天,文心 4.5 和 X1 都已在文心一言官網(wǎng)上線,免費(fèi)向用戶開放;
面對(duì)企業(yè)用戶和開發(fā)者,文心 4.5 已在百度智能云千帆大模型平臺(tái)上,輸入價(jià)格為0.004元/千tokens,輸出0.016元/千tokens,約為GPT4.5價(jià)格的1%;文心X1定價(jià)為輸入0.002元/千tokens,輸出0.008元/千tokens,也即將上線千帆。
百度搜索、文小言等百度的當(dāng)家產(chǎn)品,也正在逐步接入文心 4.5 和 X1,把最強(qiáng)大的 AI 能力讓社會(huì)普惠。
近十年,百度的累計(jì)研發(fā)投入,已經(jīng)超過 1800 億,李彥宏在今年 1 月的 25 周年全員信中寫道,很多年里,百度收入的 20% 以上,都被投入到了研發(fā)當(dāng)中——這么看,文心 4.5 和 X1 的迭代速度雖然在“意料之外”,但也算是高投入之下的“情理之中”。
然而,這次文心的雙料發(fā)布,卻遠(yuǎn)不止是新技術(shù)迭代這么簡單——百度鮮有地放下面子,用誠實(shí)的姿態(tài),把自己的優(yōu)點(diǎn)和缺點(diǎn)暴露在用戶的眼皮底下,究竟圖點(diǎn)什么?
02、百度變了
像開頭說的一樣,當(dāng)下這個(gè)時(shí)點(diǎn),在 Deepseek 占領(lǐng)了無數(shù)圈內(nèi)外用戶心智的當(dāng)口,從市場角度看,百度發(fā)布文心 4.5 和 X1 是一個(gè)正確的選擇嗎?
一樣的困境,整整兩年前,在面對(duì) OpenAI 和 ChatGPT 時(shí),百度就已經(jīng)經(jīng)歷過了一次。
當(dāng)時(shí),是李彥宏許久之后首次出席線下會(huì)議演講,還是熟悉的白襯衣、熟悉的不緊不慢的語調(diào)。甫一開場,他并沒盯著提詞器里的講稿,比起“早有預(yù)謀”的臺(tái)詞,更像有感而發(fā)的感嘆,犀利地拋出了一個(gè)問題:
“最近一段時(shí)間,很多朋友問我:‘為什么是今天,你們真的 ready 了嗎?’”
與其說這個(gè)問題問的是別人,不如說,這個(gè)問題李彥宏或許也問了自己很多遍。但思前想后,百度不怕被與 OpenAI 比較,也不怕丟面子,有好東西,必須得讓客戶和用戶先用上。
兩年后,文心 4.5 和 X1 發(fā)布,百度更是必須保證更新頻率,缺乏旗艦?zāi)P偷墓?,留?AI 的第一梯隊(duì)也難以服眾。
今天,百度變了,變得不再愛面子:
先前站隊(duì)閉源,Deepseek 通過開源嘗到了甜頭,那就聞過則喜、從善如流;
Deepseek、Llama 等模型確實(shí)各有千秋,那就踐行“拿來主義”、在搜索、地圖、文庫、智能云等 ToC、To B 產(chǎn)品體系里海納百川,讓用戶自主選擇;
在未來,智能體和 AI 應(yīng)用,沒法被一家公司大包大攬,那百度就甘當(dāng)綠葉,不做“超級(jí)應(yīng)用”,而要幫助人們打造更多“超級(jí)有用”的應(yīng)用;
過去做事慢條斯理、貽誤軍機(jī),今天在內(nèi)部,文心 4.5 全面免費(fèi),PC、移動(dòng)雙端直接上現(xiàn)貨,等等決策都在半天之內(nèi)完成,絕不拖泥帶水;
而體現(xiàn)在迭代速度上,百度模型迭代的速度仍在加快,文心 4.5 全部開放之后,最晚 6 月底就將公布開源版本,下半年則有望見到文心 5.0 的面世。
百度變得不愛面子,也變得越來越開放、越來越務(wù)實(shí)——不躺平,也不茍著。
在今年的“世界政府峰會(huì)”WGS 訪談時(shí),李彥宏提到:“我認(rèn)為創(chuàng)新不能被計(jì)劃,你不知道創(chuàng)新何時(shí)到來,你所能做的就是營造一個(gè)有利于創(chuàng)新的環(huán)境。”
枕戈待旦,百度還在謙卑地等著一個(gè)機(jī)會(huì)。但在今天,即使面臨著諸多強(qiáng)敵的挑戰(zhàn),百度還在大模型的第一梯隊(duì)嗎?
03、百度,沒下牌桌
今天,評(píng)價(jià)所謂“第一梯隊(duì)”的 AI 公司,或許還并不能存在一個(gè)共識(shí)性的標(biāo)準(zhǔn)。
幾個(gè)頂流 AI 玩家,更像八仙過海,有些以技術(shù)見長,有些重視產(chǎn)品,還有些則干脆專注市場營銷,各有各的優(yōu)勢,也各有各的活法。
如果把百度算進(jìn)第一梯隊(duì)的 AI 公司當(dāng)中,或許有人基于一貫的刻板印象,并不會(huì)同意;
然而,數(shù)據(jù)是直接、有力的,百度在中國的 AI 商業(yè)化實(shí)踐,的確可以名列前茅——2024年,文心大模型的日均調(diào)用量已經(jīng)達(dá)到了 16.5 億次,相比一年前的同期數(shù)據(jù),狂增33倍;飛槳平臺(tái)上,1808 萬個(gè)開發(fā)者和 43 萬家企業(yè),已經(jīng)創(chuàng)建了 101 萬個(gè)模型;而文心千帆已經(jīng)幫助客戶完成了 3.3 萬個(gè)模型的精調(diào)、開發(fā)了 77 萬個(gè)企業(yè)應(yīng)用。
巨大的 B、C 端使用量,已經(jīng)幫助百度建立起了一個(gè)初具動(dòng)能的用戶飛輪。同時(shí),每天不停運(yùn)轉(zhuǎn)的百度搜索、近億 AI 用戶的百度文庫,以及地圖、網(wǎng)盤等多款億級(jí)用戶產(chǎn)品,都是百度內(nèi)部試驗(yàn) AI 效能提升的試驗(yàn)田,肩負(fù)的不僅是百度這家科技公司的技術(shù)未來,更是這家上市公司的商業(yè)未來。
過去 24 個(gè)月里,AI 行業(yè)中大的變化,李彥宏說,是“大模型基本消除了幻覺”,這也讓用戶們可以更放心地使用 AI,而不擔(dān)心遭到幻覺的反噬——這也是大模型推向商業(yè)化的必要條件。
而到了 2025,不同公司的生存策略正逐漸趨同:獨(dú)角獸們?yōu)榱藵M足資本的期待,而必須展現(xiàn)自己的盈利能力;而大廠更是如此,要依靠持續(xù)不斷的現(xiàn)金業(yè)務(wù)支撐營收和財(cái)報(bào),這樣股價(jià)才能有所保障。
而 Deepseek 面世后,看似通過先進(jìn)的技術(shù)力“殺死了比賽”,其實(shí)整個(gè) AI 大行業(yè)反而有了向好的趨勢。
一方面,Deepseek 的確通過開源,救活了一些基礎(chǔ)模型能力較差的公司和產(chǎn)品,讓他們也能通過接入 Deepseek 的方式,獲得一些流量;
另一方面,Deepseek 在國內(nèi)突然爆炸式的營銷,讓不少企業(yè)單位——尤其是國央企、事業(yè)單位——一改之前對(duì) AI 的謹(jǐn)慎態(tài)度,紛紛加速擁抱 AI,讓本地部署的一體機(jī)生意在近期反而增色不少。
于是,李彥宏在今年的首次內(nèi)部講話中,他提到,加大 AI 應(yīng)用商業(yè)化實(shí)踐同樣相當(dāng)重要。AI 應(yīng)用在全行業(yè)的爆發(fā),只會(huì)加速玩家的淘汰,而那些缺乏商業(yè)化能力的公司和產(chǎn)品,恐怕更要遭殃。
早在別人大談 AGI 時(shí),百度就很早提出要在商業(yè)化落地上取得成績,要通過 AI 業(yè)務(wù)給自己造血,絲毫沒有行業(yè)“前輩”的“偶像包袱”——翻譯過來就是:“賺錢,不寒摻?!?/p>
百度的商業(yè)化保證,是其作為一個(gè)25年大廠日積月累的龐大矩陣。百度底層有芯片,有智算中心、萬卡集群;中間有模型,有模型精調(diào)、APP 開發(fā)工具鏈、有大模型商店;頂層有自己的原生 AI 產(chǎn)品,有亟待重構(gòu)的老牌大 DAU 產(chǎn)品,有豐富的渠道和頗具深度的用戶池子——中間不少要素,即使是同等量級(jí)的大廠也難望項(xiàng)背。
今天,百度還帶著兩款技術(shù)更先進(jìn),免費(fèi)的文心大模型前來挑戰(zhàn),而還很少有人知道,百度文心 5.0 的底牌究竟長什么樣子。
能留在牌桌上,百度的底牌,是它獨(dú)特的生態(tài)位,是它巨大的體量和它平臺(tái)型、生態(tài)型公司的特點(diǎn),讓它可以與整個(gè)大賽道與有榮焉。
04、結(jié)語
相比兩年前,AI 大模型的賽道,變化其實(shí)沒有那么大。
誠然,技術(shù)在日新月異地進(jìn)步,玩家們來了又走,七百多天里,賽道經(jīng)歷了百端待舉,也經(jīng)歷了“群模亂舞”。今天市場重回理性,Deepseek 又強(qiáng)勢入局,頗有一掃六合之勢;Manus 又以智能體作為切口,讓人們對(duì) AI 產(chǎn)生了新的遐想。
但未曾改變的是,AI 的方向仍然被一群人引領(lǐng)著。他們兼具浪漫主義與實(shí)干家精神,技術(shù)頭腦與商業(yè)眼光,讓他們能夠一直目光如炬,照亮自己,也同樣照亮他人的前路。
今天的百度亦屬于這個(gè)行伍,他們是天生的挑戰(zhàn)者,挑戰(zhàn)更強(qiáng)的對(duì)手,挑戰(zhàn)更復(fù)雜的技術(shù),挑戰(zhàn)昨天的自己。
當(dāng)心中有夢的時(shí)候,面子又算得了什么呢?