• 正文
    • 中國(guó)大模型遍地開花
    • RAG技術(shù),百度引領(lǐng)
    • 2025,中國(guó)大模型的提速之年
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

DeepSeek點(diǎn)燃國(guó)產(chǎn)大模型斗志,RAG等核心技術(shù)被重估

02/05 14:30
652
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

克雷西 發(fā)自 凹非寺,量子位 | 公眾號(hào) QbitAI

黑馬DeepSeek-R1的崛起,給外國(guó)網(wǎng)友上演了一場(chǎng)來(lái)自東方的震撼。

一邊,OpenAI和Claude都破了大防,一個(gè)聲討“竊取”,一個(gè)嘲諷“落后”,兩家水火不容的對(duì)手竟然以這種戲劇性的方式,鮮有地達(dá)成了一致。

另一邊,微軟、亞馬遜等云服務(wù)廠商,甚至英偉達(dá)都開啟了“真香”模式,你追我趕地在自家云平臺(tái)上線DeepSeek-R1。

但不管破防還是真香,DeepSeek-R1都已經(jīng)成為一股震撼硅谷的“東方神秘力量”。

DeepSeek,不是一個(gè)人在戰(zhàn)斗,背后也是中國(guó)大模型的全面崛起

中國(guó)大模型遍地開花

在各個(gè)領(lǐng)域,中國(guó)的大模型都不缺乏強(qiáng)者,而且各具特色。

就拿DeepSeek-R1來(lái)說(shuō),它的特色在于成本極低,也正是這一點(diǎn)戳到了OpenAI和Claude的痛處。

做搜索出身的百度,將積累下來(lái)的技術(shù)經(jīng)驗(yàn)用到了模型產(chǎn)品當(dāng)中,把RAG能力做成了模型特色,讓文心一言成為了RAG領(lǐng)域的最強(qiáng)選手。

在文字之外,語(yǔ)音是一種更加自然的對(duì)話方式,在這方面,字節(jié)的豆包就有強(qiáng)大的端到端對(duì)話,能夠處理復(fù)雜的中文內(nèi)容,甚至感知人類情緒,總之是一點(diǎn)不輸給OpenAI的《Her》。

除了和對(duì)話相關(guān)的模型,在視頻生成領(lǐng)域還有異軍突起的快手可靈,視頻質(zhì)量已經(jīng)實(shí)現(xiàn)對(duì)Sora的超越。

可靈的出現(xiàn)也帶動(dòng)了一系列國(guó)產(chǎn)視頻生成模型的發(fā)展,后來(lái),字節(jié)的即夢(mèng)、阿里的通義萬(wàn)相,還有來(lái)自大模型六小虎以及獨(dú)立的視頻模型廠商,都紛紛上線自己的產(chǎn)品。

等到國(guó)產(chǎn)模型擁有了成熟的應(yīng)用和商業(yè)模式,OpenAI的Sora才終于姍姍來(lái)遲,但與Demo剛剛出現(xiàn)時(shí)的驚艷相比已是泯然眾人。

而在從模型走向應(yīng)用的路上,有一項(xiàng)能力,它的名字不像視頻生成、文本對(duì)話這樣一目了然,但扮演著重要的角色。

它就是剛剛提到的RAG

RAG技術(shù),百度引領(lǐng)

所謂RAG,就是檢索增強(qiáng)生成,它通過(guò)引入檢索機(jī)制,使得模型在生成回答時(shí)能夠參考更多的信息,從而提高了回答的準(zhǔn)確性和豐富性。

RAG之所以重要,在于它可以幫助模型解決這樣幾個(gè)問(wèn)題:

一是大模型無(wú)法針對(duì)訓(xùn)練完成之后的信息進(jìn)行回答,RAG可以迅速補(bǔ)充;

二是大模型部分情況下存在幻覺,RAG可以通過(guò)引入外部資料降低幻覺現(xiàn)象;

三是通過(guò)對(duì)外部資料的調(diào)用,讓模型生成的答案更加權(quán)威透明。

而在RAG能力上,國(guó)內(nèi)同樣有著一位強(qiáng)者,它就是百度的文心一言。

光說(shuō)不練沒有說(shuō)服力,接下來(lái)就拉文心一言和ChatGPT比試一番。

既然RAG的一大用途是解決訓(xùn)練完成后的信息問(wèn)題,考察的題目也得有時(shí)效性。

蛇年春晚《借傘》節(jié)目中,一共出現(xiàn)了幾對(duì)青蛇白蛇?(答案:六對(duì))

但ChatGPT這里,雖然也搜到了相關(guān)內(nèi)容,還像模像樣地給出了視頻,但標(biāo)注引用的鏈接當(dāng)中并不包含答案,而且回答的數(shù)字也是錯(cuò)的。

不過(guò)在實(shí)際場(chǎng)景中,我們不一定會(huì)一次只問(wèn)一個(gè)問(wèn)題,而是連珠炮似的拋出一串問(wèn)題,并且說(shuō)話的過(guò)程中還會(huì)出現(xiàn)省略,這就對(duì)模型理解問(wèn)題提出了更高的要求。

第五航權(quán)是指什么?能夠進(jìn)行什么樣的客貨運(yùn)輸?和第八航權(quán)有什么區(qū)別?

這波文心一言成功捕捉了三個(gè)問(wèn)題并一一給出正確解答,而且在對(duì)比兩個(gè)概念的區(qū)別時(shí)還采用了表格的方式,更加易于理解其不同。

相比較之下,ChatGPT說(shuō)的雖然也對(duì),但區(qū)別的部分只是把兩個(gè)概念各自介紹了一遍,看上并沒有那么一目了然。

除了連環(huán)提問(wèn),也可以在問(wèn)題本身上設(shè)置難度,詢問(wèn)一些極其專業(yè)的問(wèn)題。

在有機(jī)化學(xué)當(dāng)中,周環(huán)反應(yīng)既不產(chǎn)生離子也不產(chǎn)生自由基,這種反應(yīng)為什么能夠發(fā)生?

結(jié)果呢,文心一言不僅解答了疑問(wèn),還補(bǔ)充介紹了相關(guān)化學(xué)反應(yīng)的概念和分類,甚至最后還附上了視頻課程,方便我們進(jìn)一步學(xué)習(xí)。

從以上場(chǎng)景可以看出,文心一言的RAG能力,已經(jīng)達(dá)到了相當(dāng)出色的水平。

在這背后,百度研發(fā)了“理解-檢索-生成”協(xié)同優(yōu)化的檢索增強(qiáng)技術(shù),將回答問(wèn)題的過(guò)程拆分成了三個(gè)階段:

理解階段,基于大模型理解用戶需求,對(duì)知識(shí)點(diǎn)進(jìn)行拆解;

檢索階段,面向大模型進(jìn)行搜索排序優(yōu)化,并將搜索返回的異構(gòu)信息統(tǒng)一表示,送給大模型;

生成階段,綜合不同來(lái)源的信息做出判斷,并基于大模型邏輯推理能力,解決信息沖突等問(wèn)題,從而生成準(zhǔn)確率高、時(shí)效性好的答案。

在國(guó)內(nèi)的互聯(lián)網(wǎng)大廠中,百度是靠搜索起家的,因此在搜索這件事上形成的技術(shù)積累,鮮有廠商能夠與之一比。

做搜索積累的經(jīng)驗(yàn),成了百度獨(dú)有的競(jìng)爭(zhēng)優(yōu)勢(shì),所以百度在RAG上表現(xiàn)出色,也就不難理解了。

2025,中國(guó)大模型的提速之年

DeepSeek-R1的出現(xiàn),在國(guó)際舞臺(tái)上標(biāo)志著國(guó)產(chǎn)模型擁有了更多的話語(yǔ)權(quán)。

吳恩達(dá)也撰寫了長(zhǎng)文,肯定了國(guó)產(chǎn)模型的創(chuàng)新,并針對(duì)DeepSeek談了他的看法。

吳恩達(dá)認(rèn)為,國(guó)產(chǎn)模型和世界頂尖水平的差距越來(lái)越小,甚至某些方面和技術(shù)點(diǎn)出現(xiàn)了領(lǐng)先跡象。

并且DeepSeek發(fā)現(xiàn)了AI進(jìn)步的新范式,通過(guò)算法的創(chuàng)新實(shí)現(xiàn)了模型能力的提升,擺脫了高端算力依賴。

另外,DeepSeek和OpenAI之間的30倍價(jià)差,正在加速基礎(chǔ)模型的商品化

按照吳恩達(dá)的總結(jié)繼續(xù)推論下去,在這個(gè)前景之下,中國(guó)的市場(chǎng)和用戶規(guī)模,在大模型進(jìn)入應(yīng)用階段后,非??善?。

甚至能再次復(fù)制移動(dòng)互聯(lián)網(wǎng)時(shí)代,中國(guó)應(yīng)用們?cè)趧?chuàng)新飛輪上的路徑。

所以,DeepSeek不僅在外打出了名聲,也點(diǎn)燃了國(guó)內(nèi)廠商的斗志和信心。

毫無(wú)疑問(wèn),今年國(guó)內(nèi)將誕生更多、更強(qiáng)大的模型,給全球網(wǎng)友帶來(lái)更多的東方震撼。

最早在大模型上交卷的百度就透露,將在今年推出全新的文心5.0大模型

所以2025,很可能是國(guó)產(chǎn)AI從追趕走向并駕齊驅(qū),甚至可以期待超車的一年。

相關(guān)推薦