• 正文
    • “文心一言”是表,“昆侖芯”是實
    • 百度“昆侖芯”的野望
    • 造芯火熱
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

百度“文心一言”遇冷,背后的“昆侖芯”火熱

原創(chuàng)
2023/03/17
3268
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論
就在國產(chǎn)ChatGPT“文心一言”發(fā)布的時候,百度港股卻應聲下跌近10%。用戶不買賬?技術不過關?拋開似乎是“趕鴨子上架”般的文心一言外殼,百度AI成功與否的關鍵,還得看背后的“昆侖芯”。

2023年3月16日下午兩點,百度創(chuàng)始人、董事長、CEO李彥宏宣布文心一言正式發(fā)布。李彥宏介紹指出,文心一言具有文學創(chuàng)作、商業(yè)文案創(chuàng)作、多模態(tài)生成、數(shù)理邏輯推算、中文理解等能力。李彥宏在在開場白中表示:“百度文心一言‘十月懷胎’,終于‘一朝分娩’?!?/p>

不過資本市場似乎察覺到了“文心一言”上市的急迫心理。發(fā)布會是兩點準時開的,股票也是應聲暴跌的。14時22分,百度股價跌幅擴大至近10%,截至收盤,百度當天下跌收至6.36%。記者在“文心一言”發(fā)布的第一時間嘗試體驗一下,卻發(fā)現(xiàn)它的官網(wǎng)并不像ChatGPT一樣擁有簡單直接的搜索入口,進入文心一言(ERNIE Bot)頁面需要點擊上方的二級導航欄才能找到。重要的是,目前該頁面依舊處于未開放狀態(tài),要想真正體驗到中國版ChatGPT還需要等一等,這或許也是百度開了發(fā)布會,卻導致股票下跌的原因之一。李彥宏也在發(fā)布會上直言:“作為國內(nèi)大型企業(yè)中首家發(fā)布“類ChatGPT”產(chǎn)品的企業(yè),百度之所以選擇最先發(fā)布,是因為市場有需求,百度包括搜索、智能云以及小度音響等在內(nèi)的產(chǎn)品,以及眾多的合作伙伴,都等待著用這項技術,百度需要盡早的發(fā)布這項技術。”,“內(nèi)測中“文心一言”并不完美,但市場有需求必須要推出來?!?/p>

 

近年來百度的發(fā)展遭遇瓶頸,無論是家喻戶曉的百度搜索,還是曾經(jīng)人手必備的百度貼吧,都難以再取得往日輝煌,連“BAT”領頭羊的“B”如今也被字節(jié)跳動取代。百度在舊戰(zhàn)場失利,卻在新賽道上蓄力已久。早在2016,李彥宏就已經(jīng)在為AI搖旗吶喊,曾講出“移動互聯(lián)網(wǎng)的時代已經(jīng)結(jié)束?!?,“我看之前那些講互聯(lián)網(wǎng)下半場的人,今天都開始講人工智能了。”

不過這幾年“AI”一直不冷不熱,VR/AR、元宇宙、區(qū)塊鏈等概念的炒作一波接一波,但都是雷聲大雨點小,大部分都只是停在PPT上,百度就像“地主家的傻兒子”般持續(xù)押寶,自研的AI芯片“昆侖”系列持續(xù)迭代。進入2023年,ChatGPT的出現(xiàn)終于讓“AI”真正熱了起來。風口來臨,有了芯片的百度還能再起飛嗎?

 

“文心一言”是表,“昆侖芯”是實

2018年,自然語言處理NLP領域進入了LLM時代。谷歌出品的Bert模型,碾壓了以往的所有模型,學會了如何從大量的數(shù)據(jù)中學習復雜的上下文聯(lián)系。于此同時,OpenAI也基于Transformer模型發(fā)布了初代GPT。Transformer是一個利用注意力機制來提高模型訓練速度的模型,它適用于并行化計算,可以對輸入的文本進行重新編解碼,通過各類矩陣函數(shù),將輸入數(shù)據(jù)分配到眾多NPU中并行計算,最后輸出最可能的結(jié)果,Bert和GPT都是Transformer的衍生品。Transformer的提出,使得深度學習模型參數(shù)突破了1億,GPT-1也應用了上億規(guī)模的參數(shù)量,數(shù)據(jù)集約有25億單詞量。

圖源 | syncedreview.com

此后OpenAI持續(xù)迭代GPT系列,GPT-2在GPT的基礎上,添加了多個任務,擴增了數(shù)據(jù)集和模型參數(shù),其參數(shù)量達到了15億規(guī)模,使用了800萬在Reddit被鏈接過的網(wǎng)頁數(shù)據(jù)。GPT-3擁有1750億個可調(diào)節(jié)參數(shù),其語料庫大小達到了45TB。而ChatGPT是基于GPT-3.5制造的,其可調(diào)參數(shù)與語料庫訓練量將更為驚人。GPT的每一代均相比前一代有了數(shù)量級的飛躍,百度要想將“文心一言”塑造一個比肩ChatGPT的AI大模型,其數(shù)據(jù)運算量絕不會小,起碼在數(shù)量級上應處于同一水平。

而處理這些海量語料庫的背后,其實是成百上千顆AI芯片的并行計算。記者曾在之前的文章《ChatGPT如何驅(qū)使上千顆GPU為你工作》中講到,若使用8張英偉達V100GPU計算45TB數(shù)據(jù),需要連續(xù)工作36年,若將這些數(shù)據(jù)平均分布到1000張英偉達H100 GPU中,單顆ALU僅會分到2.6KB左右的計算量,總計算量將會減少至數(shù)天。即使是在用戶使用模型的時候,也會有數(shù)量眾多GPU藏在“大模型”背后為你計算。

然而早在2022年8月26日,美國政府就向英偉達下達通知,要求對A100、H100進行新的出口管制許可,并立即生效。這也意味著中國的大模型計算也會受到美國限制,中國需要用自己的AI芯片來計算大模型了。中美在AI大模型上爭得頭破血流,看似是軟件的比拼,實質(zhì)上還是要在芯片上一決高下。

“文心一言”和“ChatGPT”是表,“昆侖芯”與“英偉達”是實。

 

百度“昆侖芯”的野望

2021年6月,百度智能芯片及架構部門完成獨立融資,成立昆侖芯(北京)科技有限公司,首輪估值約130億元,百度芯片首席架構師歐陽劍出任昆侖芯公司CEO。在此之前一年,百度已經(jīng)試產(chǎn)了第一代云端通用人工智能計算處理器“昆侖1”芯片,這在當時國內(nèi)唯一一款經(jīng)歷過互聯(lián)網(wǎng)大規(guī)模核心算法考驗的云端AI芯片。在芯片部門獨立融資兩個月后,百度就宣布第二代昆侖芯片“昆侖2”正式量產(chǎn)。

事實上,百度在AI領域的布局野心很大,“文心一言”只是基于百度文心大模型研發(fā)的其中一小步。這點在百度文心的官網(wǎng)上也能看到,對話功能僅僅占了文心大模型總體規(guī)劃的一小塊。假如沒有ChatGPT的橫空出世引爆全球,或許“文心一言”還得在項目檔期表上躺個一年半載。

 

“文心一言”之外, “昆侖芯”在自動駕駛上的押注要更多。阿波羅(Apollo)是百度發(fā)布的面向汽車行業(yè)及自動駕駛領域的合作伙伴提供的軟件平臺。整個系統(tǒng)基于文心大模型“感知 2.0”架構組建,其中昆侖系列芯片是該系統(tǒng)的核心,也是未來L4級別自動駕駛的必需要素。根據(jù)百度方面的說法,未來自動駕駛也會和“文心一言”進行整合。事實上微軟已經(jīng)嘗試將ChatGPT與Bing搜索結(jié)合并取得了不錯的成績,未來百度也可以跟著微軟的道路實行大模型商業(yè)化運營。

不過押上了百度“身家性命”的昆侖芯,其落地應用卻令人十分迷惑。目前國內(nèi)AI芯片賽道玩家不少,寒武紀、地平線等均推出了自己的產(chǎn)品。在云計算領域,寒武紀已經(jīng)拿下國內(nèi)AI芯片市場的30%,僅次于英偉達。地平線也與上汽、一汽、蔚來等廠商深度合作,提供自動駕駛相關AI芯片。“昆侖”呢?自“昆侖2”量產(chǎn)已經(jīng)過去兩年,今天記者依舊很難從互聯(lián)網(wǎng)上搜索到除百度之外的廠商應用昆侖芯片的痕跡。據(jù)了解,有消息稱全國各地都有超算中心應用昆侖芯片,也有部分工業(yè)檢測廠家購買了昆侖芯片的檢測儀器,除此之外再難見蹤跡,其具體應用情況難以查詢。拆分出來的昆侖,似乎還是百度的一個部門,獨立融資圖啥?

 

造芯火熱

目前谷歌、亞馬遜、阿里巴巴、騰訊、字節(jié)跳動等互聯(lián)網(wǎng)企業(yè)均投身造芯領域,百度只是其中動身較早的玩家。尤其是近年來美國持續(xù)加大對華半導體行業(yè)的限制,中國對于國產(chǎn)芯的需求愈發(fā)強烈,全國各地紛紛掀起了“造芯熱潮”。但造芯哪有那么簡單。

芯片制造業(yè)是一項極為復雜、困難的技術活動,需要高超的人才、雄厚的資金和長期的研發(fā)投入。尤其是在制程工藝、芯片設計和設備研發(fā)等方面,需要積累大量的經(jīng)驗和技術儲備。這些都需要中國政府、企業(yè)和投資者做出長期的努力和投入,以建立起一個可持續(xù)的芯片產(chǎn)業(yè)鏈。今天百度能搶在3月發(fā)布“文心一言”大模型,實際上背后已經(jīng)有了近10年在AI行業(yè)的積累,雖然效果不盡如人意,但這仍然是國內(nèi)唯一一款很快能上線的聊天大模型?!拔男囊谎浴北澈蟮腁I芯片技術,也是依托百度作為曾經(jīng)全國前三的互聯(lián)網(wǎng)企業(yè)的深厚資金功底支撐才能不停迭代。

AI風口+造芯熱潮,又會有一批企業(yè)將隨之“起飛”,“昆侖”芯或許也會隨著“文心一言”的完善成為資本熱捧的對象。不過造芯可“飛”不得,盲目入局遇到坎坷,百度是遇冷,其他企業(yè)或許就是“滅頂之災”。

百度

百度

百度是擁有強大互聯(lián)網(wǎng)基礎的領先AI公司。是全球為數(shù)不多的提供AI芯片、軟件架構和應用程序等全棧AI技術的公司之一,被國際機構評為全球四大AI公司之一。百度以“用科技讓復雜的世界更簡單”為使命,堅持技術創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。

百度是擁有強大互聯(lián)網(wǎng)基礎的領先AI公司。是全球為數(shù)不多的提供AI芯片、軟件架構和應用程序等全棧AI技術的公司之一,被國際機構評為全球四大AI公司之一。百度以“用科技讓復雜的世界更簡單”為使命,堅持技術創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。收起

查看更多

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

與非網(wǎng)行業(yè)分析師。工科背景,擅長與初創(chuàng)企業(yè)打交道,帶你分析最新行業(yè)政策,解讀新聞背后的故事。