• 正文
    • ChatGPT到底是個(gè)什么鬼?
    • ChatGPT背后的芯片
    • 結(jié)語(yǔ)
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

ChatGPT爆火,能帶飛哪些芯片?

2023/02/15
1705
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

最近兩周,全球人民都想和一個(gè)叫ChatGPT的聊天,搞得服務(wù)器兩天宕機(jī)了五次......

這個(gè)在去年11月底,由人工智能實(shí)驗(yàn)室OpenAI推出的AI程序,上線5天內(nèi)收獲超100萬(wàn)的注冊(cè)量,到今年1月末已經(jīng)突破1億!要知道,TikTok達(dá)成1億小目標(biāo)花了9個(gè)月,Twitter可是用了60個(gè)月!這“漲粉”速度不去帶貨真是可惜了......

能瞬間在全球范圍內(nèi)成為“當(dāng)紅炸子雞”,并且讓中國(guó)AI概念股股民狂喜的ChatGPT到底是何方神圣?它的爆火說(shuō)明了什么?它的背后又和芯片有哪些關(guān)系?

閱讀本文,你將了解以下內(nèi)容:

1. ChatGPT是什么?

2. ChatGPT背后的芯片

ChatGPT到底是個(gè)什么鬼?

官方點(diǎn)說(shuō),ChatGPT是由OpenAI開(kāi)發(fā)的一個(gè)人工智能聊天機(jī)器人程序。將它的名字拆開(kāi)來(lái),“Chat”指聊天,就是它的展現(xiàn)形式;“GPT”則代表Generative Pre-trained Transformer(生成型預(yù)訓(xùn)練變換模型),即支撐它運(yùn)行的預(yù)訓(xùn)練模型。ChatGPT使用了Transformer架構(gòu)并訓(xùn)練了大量的文本數(shù)據(jù),能夠進(jìn)行語(yǔ)言翻譯、問(wèn)答、對(duì)話等任務(wù)。

從體驗(yàn)上來(lái)說(shuō),它像是有想法、會(huì)學(xué)習(xí)的高階版“小愛(ài)同學(xué)”,能通過(guò)不斷的對(duì)話記住你提供的信息,來(lái)不斷豐富自己的語(yǔ)料庫(kù)并提供答案。

沒(méi)錯(cuò),在你對(duì)面的,是一個(gè)真正的工具“人”。

ChatGPT眼中的自己

AI出現(xiàn)了那么久?為什么這個(gè)這么火爆?

GPT的核心結(jié)構(gòu)是Transformer。想要完整了解ChatGPT,得先從它說(shuō)起。

Transformer是是一種采用自注意力機(jī)制的深度學(xué)習(xí)模型。簡(jiǎn)而言之,神經(jīng)網(wǎng)絡(luò)是一種非常有效的模型類型,用于分析圖像、視頻、音頻和文本等復(fù)雜數(shù)據(jù)類型。

在它之前,我們使用深度學(xué)習(xí)來(lái)處理輸入序列的方式是使用一種叫做循環(huán)神經(jīng)網(wǎng)絡(luò)的RNN的模型。它要求輸入的數(shù)據(jù)必須順序正確,因?yàn)樗荒馨错樞蛞粚?duì)一的輸出,所以RNN很難達(dá)到并行化,這意味著我們不能通過(guò)使用更多的GPU來(lái)加快訓(xùn)練。

來(lái)源:知乎用戶@張俊林

Transformer則能夠一次性處理所有輸入數(shù)據(jù),不再要求順序準(zhǔn)確,可以非常有效地進(jìn)行并行化操作。也就是說(shuō),如果有合適的硬件條件,我們可以訓(xùn)練一些真正的大模型。

來(lái)源:知乎用戶@張俊林

GPT便是以此架構(gòu)為基礎(chǔ)誕生的。

第一代的GPT-1在2018年發(fā)布,首次采用了 Transformer 架構(gòu)作為特征抽取器,解決了傳統(tǒng) RNN 結(jié)構(gòu)的缺陷與效率問(wèn)題。然而,當(dāng)時(shí)的數(shù)據(jù)量只有1億多,和現(xiàn)在動(dòng)輒千億比起來(lái)少得可憐,因此它的表現(xiàn)并不好,只在問(wèn)題回答、語(yǔ)義相似度評(píng)估、語(yǔ)義確定、文本分類任務(wù)中簡(jiǎn)單應(yīng)用。畢竟數(shù)據(jù)量越大,機(jī)器學(xué)習(xí)得以學(xué)習(xí)的基礎(chǔ)越多,效果更精準(zhǔn)、更智能的可能性就越高。

GPT-2在下一年發(fā)布,底層架構(gòu)沒(méi)變,參數(shù)量有了大幅的提升。到了GPT-3,模型參數(shù)達(dá)到了1750億個(gè),它已經(jīng)可以完成答題、寫(xiě)論文、文本摘要、語(yǔ)言翻譯和生成計(jì)算機(jī)代碼等真正意義的 AI 創(chuàng)作。

為什么前面幾版都悄無(wú)聲息,到了ChatGPT突然大爆了呢?

簡(jiǎn)單來(lái)說(shuō),就是能力發(fā)生了質(zhì)變,一下子變得好“?!?。

ChatGPT是在GPT-3衍生而出的GPT3.5上進(jìn)行微調(diào)而誕生。

ChatGPT 采用了 RHLF (Reinforcement Learning from Human Feedback,基于人類反饋的強(qiáng)化學(xué)習(xí))算法,采用人工標(biāo)注的方式將NLP(Natural Language Processing,自然語(yǔ)言處理)和RL(Reinforced Learning 強(qiáng)化學(xué)習(xí))結(jié)合起來(lái),極大地提升了模型效率和學(xué)習(xí)能力。

此前的GPT-2和GPT-3為了大幅增加參數(shù)量,都采用無(wú)監(jiān)督學(xué)習(xí)模式,也就是輸入一堆數(shù)據(jù),讓模型自己去學(xué),不進(jìn)行人工干涉。而到了ChatGPT,為了讓他更好用,引入了人工標(biāo)注數(shù)據(jù)和強(qiáng)化學(xué)習(xí),可以讓大模型更理解信息的含義,并進(jìn)行自我判斷——也就是更貼近理想中的人工智能效果。也就是說(shuō),以前對(duì)的錯(cuò)的一起全吸收了,現(xiàn)在則有人告訴它對(duì)錯(cuò),讓他更懂。

就像我們?cè)谑褂肅hatGPT的時(shí)候,前面問(wèn)得越多、給出的信息越多,它提供的回答便會(huì)更符合我們的要求。


只要鋪墊夠多,2+5也可以是8

ChatGPT 代表著 AI 技術(shù)的新一輪突破,并且大概率預(yù)示著 NLP 技術(shù)有望迅速進(jìn)入平民化應(yīng)用時(shí)代,相關(guān)技術(shù)不僅對(duì)眾多的 C 端應(yīng)用帶來(lái)革新,同時(shí)也將對(duì) B 端應(yīng)用產(chǎn)生重大影響。

微軟在2月7日宣布將ChatGPT引入旗下的搜索引擎必應(yīng)和Edge瀏覽器。這一下子讓整個(gè)互聯(lián)網(wǎng)圈炸開(kāi)了鍋,一些龍頭企業(yè)火速跟上:谷歌宣布推出AI對(duì)話機(jī)器人“Bard”(吟游詩(shī)人);百度宣布類似ChatGPT的項(xiàng)目“文心一言”3月面世......

短時(shí)間內(nèi)重磅消息頻出,ChatGPT終于破圈,遍地開(kāi)花。

ChatGPT背后的芯片

一般內(nèi)容創(chuàng)作分為三個(gè)階段:專業(yè)生產(chǎn)內(nèi)容(PGC)、用戶生產(chǎn)內(nèi)容(UGC)、AI生產(chǎn)內(nèi)容(AI Generated Content,AIGC)。早期專業(yè)視頻門戶網(wǎng)站采用PGC模式,而現(xiàn)在一些主流的社交平臺(tái)如抖音、小紅書(shū)、微博等是以UGC為核心的傳播方式。

目前以PGC、UGC為主,AIGC為輔,AIGC被認(rèn)為是繼PGC和UGC后,新的內(nèi)容創(chuàng)作方式。

ChatGPT只是AIGC中的一環(huán),如AI寫(xiě)作、AI作曲以及此前爆火的AI繪畫(huà)等都屬于AIGC中的一種。隨著AI技術(shù)的成熟,過(guò)去的“人工智障”已經(jīng)蛻變成“數(shù)字人”,在娛樂(lè)、金融、零售業(yè)等發(fā)揮著作用:早在2016年的里約奧運(yùn)會(huì)上,寫(xiě)稿機(jī)器人就參與了賽事報(bào)道。光百度推出的數(shù)字人系列就包括AI手語(yǔ)主播、虛擬偶像、虛擬編輯等,其AI技術(shù)已經(jīng)用于央視,并參與了去年兩會(huì)的報(bào)道。

ChatGPT是一種基于大規(guī)模語(yǔ)言模型的超智能對(duì)話AI產(chǎn)品,無(wú)論是探討概念化的AIGC,還是爆火的ChatGPT,本質(zhì)上是在探討其背后的AI產(chǎn)業(yè)鏈。

人工智能三大要素:數(shù)據(jù)、算法、算力,這三大要素相輔相成,缺一不可。

如前文所述,ChatGPT是基于OpenAI的第三代大模型GPT-3升級(jí)而來(lái),從GPT一代到三代,模型參數(shù)量已經(jīng)來(lái)到1750億個(gè),理論上參數(shù)量會(huì)隨著算力的增長(zhǎng)而增長(zhǎng),極限在哪尚未知。

而算力的來(lái)源就是芯片。ChatGPT的爆紅,勢(shì)必會(huì)推動(dòng)AI芯片產(chǎn)業(yè)的發(fā)展。

來(lái)源:ChatGPT——生成式AI迎來(lái)拐點(diǎn),商用落地前景可期,國(guó)泰君安證券

AIGC產(chǎn)業(yè)鏈可以分為計(jì)算硬件層、云計(jì)算平臺(tái)、模型層及應(yīng)用層。雖然ChatGPT比拼的是模型層和應(yīng)用層,但計(jì)算硬件層無(wú)疑是背后的支柱。

AI算力芯片泛指加速AI類應(yīng)用用,主要分為GPU、FPGA、ASIC。由于CPU的算力很有限,且處理并行操作比較吃力,因此一般將CPU搭配加速芯片使用。具體來(lái)看,GPU最初是用于圖像處理的芯片,但其通用性強(qiáng),適用于大規(guī)模并行計(jì)算,且算力遠(yuǎn)優(yōu)于CPU,因此很適合人工智能,這一數(shù)據(jù)密集型的應(yīng)用場(chǎng)景;FPGA的優(yōu)勢(shì)在于開(kāi)發(fā)周期短、靈活性高,大量應(yīng)用在線上數(shù)據(jù)中心、軍工領(lǐng)域等;ASIC的優(yōu)勢(shì)在于小型化、低功耗、高性能,一般用于消費(fèi)電子,同時(shí)也適合AI運(yùn)算場(chǎng)景。

ChatGPT背后的計(jì)算集群使用的是英偉達(dá)的AI芯片。OpenAI曾表示,ChatGPT 是與英偉達(dá)和微軟合作完成的超級(jí)AI。微軟在自己的云——Azue HPC Cloud中構(gòu)建了超級(jí)計(jì)算機(jī)集群,將其提供給OpenAI。據(jù)悉,該超級(jí)計(jì)算機(jī)擁有 285000個(gè)CPU(中央處理器)內(nèi)核和10000多顆AI芯片。

除了算力芯片外,AI對(duì)話程序在執(zhí)行計(jì)算期間需要大容量、高速的存儲(chǔ)支持,預(yù)計(jì)高性能存儲(chǔ)芯片需求也會(huì)增長(zhǎng)。三星電子就表示,為GPU和人工智能加速器提供數(shù)據(jù)的高性能高帶寬內(nèi)存 (HBM) 的需求將會(huì)擴(kuò)大。從長(zhǎng)遠(yuǎn)來(lái)看,隨著AI聊天機(jī)器人服務(wù)的擴(kuò)展,對(duì)用于CPU的128GB 或更大容量的高性能 HBM 和高容量服務(wù)器 DRAM 的需求預(yù)計(jì)會(huì)增加。

降本、降功耗成為發(fā)展AI專用芯片的方向。據(jù)了解,采購(gòu)一片英偉達(dá)頂級(jí)GPU成本為8萬(wàn)元,GPU服務(wù)器成本通常超過(guò)40萬(wàn)元。對(duì)于ChatGPT而言,一次模型訓(xùn)練成本超過(guò)1200萬(wàn)美元。正如OpenAI CEO SamAltman曾在推文中所說(shuō)的那樣:“用戶每次與ChatGPT進(jìn)行聊天,會(huì)花費(fèi)幾美分?!?/p>

隨著SoC技術(shù)的發(fā)展,越來(lái)越多的企業(yè)開(kāi)始推出自研的AI專用芯片,如谷歌的張量處理器TPU、英偉達(dá)的數(shù)據(jù)處理器(DPU)BlueField系列、百度的昆侖系列、華為的昇騰系列、阿里巴巴平頭哥的含光800等。億歐智庫(kù)的數(shù)據(jù)顯示,隨著大算力中心的增加以及終端應(yīng)用的逐步落地,中國(guó)AI芯片需求也持續(xù)上漲。2021年疫情緩解,市場(chǎng)回暖,產(chǎn)生較大增幅;類腦等新型芯片預(yù)計(jì)最早于2023年進(jìn)入量產(chǎn),因此2024及2025年或有較大增長(zhǎng),預(yù)計(jì)市場(chǎng)規(guī)模將于2025年達(dá)到1740億元。

從AI芯片的計(jì)算功能來(lái)看,由于AI應(yīng)用模型首先要在云端經(jīng)過(guò)訓(xùn)練、調(diào)優(yōu)與測(cè)試,計(jì)算的數(shù)據(jù)量與執(zhí)行的任務(wù)量數(shù)以萬(wàn)計(jì),云端訓(xùn)練需求是AI芯片市場(chǎng)的主流需求。而到后期,訓(xùn)練好的AI應(yīng)用模型轉(zhuǎn)移到端側(cè),結(jié)合實(shí)時(shí)數(shù)據(jù)進(jìn)行推理運(yùn)算、釋放AI功能,推理需求逐漸取代訓(xùn)練需求,帶動(dòng)推理芯片市場(chǎng)崛起。2025年,云端推理與端側(cè)推理成為市場(chǎng)規(guī)模增長(zhǎng)的主要拉動(dòng)力,提升了逐漸下滑的AI芯片市場(chǎng)規(guī)模同比增速。

中國(guó)AI芯片市場(chǎng)入局者眾多,海思半導(dǎo)體已成為國(guó)內(nèi)營(yíng)收規(guī)模最大的集成電路設(shè)計(jì)企業(yè),以昇騰系列為主要GPU產(chǎn)品,在AI終端芯片具有優(yōu)勢(shì)。云端領(lǐng)域,百度可提供云上GPU服務(wù)器;海光信息、天數(shù)智心與登臨科技均以GPU為主打,是國(guó)內(nèi)特定細(xì)分領(lǐng)域的主要競(jìng)爭(zhēng)對(duì)手。

以下是2022年中國(guó)人工智能芯片企業(yè)TOP50:

結(jié)語(yǔ)

早幾年,AI創(chuàng)業(yè)的熱潮、資本的瘋狂涌入還歷歷在目,那時(shí)憑空出現(xiàn)的“AI專家”,被搶上天的“AI程序員”,終于在潮水退去后,沉寂下來(lái)。ChatGPT的成功破圈,似乎又看到了當(dāng)初那股子“激情”再現(xiàn)。但ChatGPT還需要多久能落地?落地到底能給人們帶來(lái)些什么?落地過(guò)程中要花費(fèi)多少成本?這個(gè)成本是否能夠承擔(dān)得起?

小冰CEO李笛在談到成本問(wèn)題時(shí)表示,如果用ChatGPT的方法,小冰每天成本將高達(dá)3億元,一年成本超千億元。

且不說(shuō)這沒(méi)日沒(méi)夜的電費(fèi)賬單,就高昂的芯片價(jià)格和運(yùn)營(yíng)成本或許都能勸退不少“雄心壯志”的企業(yè)。所以,ChatGPT能發(fā)展到哪一步?又能帶動(dòng)高端芯片產(chǎn)業(yè)幾分?一切難以下定論。

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫(xiě)文章/發(fā)需求
立即登錄