亞馬遜云科技首席執(zhí)行官Adam Selipsky對亞馬遜云科技進一步增長的前景感到非常興奮。他估計,即使微軟和谷歌等大型競爭對手取得了進展,但潛在客戶中也只有10%轉(zhuǎn)向了云計算。
?這留下了很大的增長空間,他認為增長可以從哪里來?更重要的是,什么才能讓亞馬遜云科技保持競爭力。
?答案當(dāng)然是人工智能。亞馬遜云科技在人工智能領(lǐng)域大舉進軍,但也面臨一些挑戰(zhàn)。ChatGPT的開發(fā)者OpenAI與微軟簽訂了云服務(wù)獨家協(xié)議。谷歌在人工智能上下了巨大的賭注,顯然運行在自己的云服務(wù)之上,并通過谷歌云獨家銷售谷歌大模型的訪問權(quán)限。
?因此,亞馬遜云科技必須在其他方面都表現(xiàn)出色,并且仍然必須爭奪運行這些大模型所需的硬件,而這些硬件供應(yīng)正面臨極度短缺。
?人工智能競賽
?記者:現(xiàn)在,我正在關(guān)注人工智能——一個完全新生的市場。目前人工智能領(lǐng)域唯一賺錢的玩家似乎是Nvidia,它向所有人出售芯片。另一方面,消費者類人工應(yīng)用程序似乎非常熱門,但還沒有人賺到錢。因此,市場還沒有制定出一套有意義的成本結(jié)構(gòu)。您是否采用相同的方法來拓展人工智能市場?或者隨著市場的發(fā)展我們可能必須更加靈活?
?Adam:我覺得我們的基本做法是靈活的。我們有能力創(chuàng)建任何團隊來專注于需要構(gòu)建的任何東西,這比單體應(yīng)用靈活得多。人工智能是基礎(chǔ)。所有的炒作都是有原因的。我堅信,我們所交互的幾乎每一個應(yīng)用程序,無論是在職業(yè)上還是在我們的個人生活中,都將受到顯著的顛覆,并且在許多情況下,將被人工智能徹底改造。
?我認為,隨著生成式人工智能的發(fā)展越來越重要,不會再出現(xiàn)單一的生成式人工智能公司。人工智能并不是一個單獨的東西。它本質(zhì)上與云緊密相連。我為什么這么說呢?一方面,你需要一個適合你的人工智能數(shù)據(jù)策略。無論你是在談?wù)摳玫胤?wù)教育、更好地服務(wù)金融服務(wù)客戶,無論你是在談?wù)撍幬锇l(fā)現(xiàn),無論你是在談?wù)撁襟w、資產(chǎn)創(chuàng)造,你都必須知道你擁有什么數(shù)據(jù)。你必須知道你想要獲取哪些數(shù)據(jù)并將其作為生成人工智能的輸入。
?那些長期在亞馬遜云科技平臺上建設(shè)數(shù)據(jù)平臺的公司擁有巨大的優(yōu)勢,因為它們能夠?qū)?shù)據(jù)很方便地進行輸入。先進的數(shù)據(jù)平臺位于云端。它位于亞馬遜云科技上。這是一個有力的例子,說明了云中的數(shù)據(jù)和生成式人工智能如何相互綁定。
?另一個原因是,生成式人工智能并不便宜。目前它的價格非常昂貴。GPU的性能非常好,但也相當(dāng)昂貴。例如,訓(xùn)練模型的成本非常昂貴。然后,運行推理或運行模型并在生產(chǎn)中對這些模型進行查詢也非常昂貴。為了經(jīng)濟地完成這些任務(wù),你需要云。絕大多數(shù)公司都需要像亞馬遜云科技這樣的公司進行創(chuàng)新,隨著時間的推移,大幅降低成本,以推動生成式人工智能的使用量呈指數(shù)級增長。
?雖然我們確實是世界上最大的、也許是最大的基于GPU的主機之一,并且與你提到的 Nvidia 有著良好的關(guān)系,但我們也創(chuàng)新和設(shè)計自己的芯片。我們已經(jīng)有了第三代通用芯片,但我們也有用于人工智能和機器學(xué)習(xí)的專用芯片:用于訓(xùn)練模型的Trainium,然后是用于運行模型和推理的Inferentia。這些芯片都做得很好,增長很快。
?我非常有信心,因為它們擁有用于人工智能的所有芯片技術(shù)中最佳的性價比。這對于Coherent、Anthropic、Stability AI和Hugging Face等正在構(gòu)建AI模型的初創(chuàng)公司來說非常重要。當(dāng)然,對于已經(jīng)在人工智能領(lǐng)域跟亞馬遜云科技合作的老牌公司來說,也很非常重要,比如Travelers、Ryanair和Bridgewater Associates。
?因此,云和人工智能并不是兩個不同的東西。他們實際上只是同一事物的許多面孔中的兩個。因此,我認為我們的組織模式將非常相似。我們已經(jīng)建立了特定的目標(biāo)團隊來構(gòu)建Amazon Bedrock,特定的團隊來構(gòu)建我們自己的Titan模型的Amazon基礎(chǔ)模型。我們正在建立一個專門的團隊來處理CodeWhisperer,等等。
?記者:所以,這是一場比賽。看來你不認為比賽有終點。
?Adam:對于我們?nèi)魏我粋€商界人士來說,這場競賽永遠不會結(jié)束。你的表現(xiàn)取決于你今天為客戶所做的事情。亞馬遜云科技顯然是云計算的先驅(qū)。我們于2006年推出了我們今天擁有的第一個云服務(wù),S3存儲服務(wù)。它已經(jīng)17歲了。按收入計算,我們是我所見過的規(guī)模最大、利潤率最高的公司。我不知道這是否屬實,但我看到發(fā)布的統(tǒng)計數(shù)據(jù)稱我們的規(guī)??赡苁窍乱粋€最接近的競爭對手的兩倍。但我們面臨著非常激烈的競爭,而且我們才剛剛開始,我們并不比今天向客戶提供的產(chǎn)品更好。所以比賽是永恒的。這是一個無限循環(huán)。
?記者:亞馬遜云科技下一個最大的競爭對手是微軟Azure。他們?yōu)楠毤以L問OpenAI和OpenAI的模型支付了大量費用。如果要使用GPT-4,則需要簽署Azure合同。我們應(yīng)該這樣看待這場比賽嗎?該模型的獨家訪問權(quán)似乎已經(jīng)激發(fā)了每個人的想象力。
?Adam:我們以客戶為中心,從客戶出發(fā)進行工作。因此,讓我們通過列出為客戶提供服務(wù)至關(guān)重要的三件事來回答這個問題。首先是選擇和靈活性。我認為,一個模型統(tǒng)治所有是一個荒謬的主張。因為事實證明,同一個模型實際上并不適合一家公司的5個、10個或50個用例,更不用說有數(shù)千、數(shù)萬或數(shù)百萬個用例的事實。顯然必須有很多選擇。因此,我們希望實現(xiàn)這種選擇。而且,時間還早,現(xiàn)在就像生成式人工智能的第0.1天一樣,我們不知道的東西比我們已知的東西多得多。對于客戶來說,能夠進行試驗非常重要。所以第一是選擇和靈活性。
?對于任何老牌公司,尤其是企業(yè)和政府實體來說,第二點就是必須擁有安全性。安全和隱私不該被拋之腦后。但讓我感到有點驚訝的是,這個領(lǐng)域的一些早期、最著名的進入者是通過扔掉一些東西開始的。沒有安全模型,你的數(shù)據(jù)確實會通過互聯(lián)網(wǎng)泄露。你在算法上對模型所做的任何改進都可能會返回到母艦中,并使你的競爭對手受益。然后他們回來說:“哦,等一下,將會有一個V2,那將是這個的安全版本?!?/p>
?安全不僅僅涉及功能,還是一種經(jīng)營方式的哲學(xué)。如果我來到一家大型汽車公司或一家大銀行,我會說:“嘿,我有一個新數(shù)據(jù)庫,它真的很酷。它有很棒的功能?,F(xiàn)在,它并不像其他所有東西一樣安全,但別擔(dān)心,我會讓下一個版本成為安全版本。”他們會把我趕出去。實際上,他們應(yīng)該這樣做。
?我與至少10名財富500強CIO交談過,這就是為什么他們禁止在其企業(yè)中使用ChatGPT。所以,你必須問自己,誰會真正認真對待這里的安全問題。
?然后,第三個東西就是此前談到的數(shù)據(jù)。你的數(shù)據(jù)策略是生成式人工智能策略的一部分,它們不是兩個獨立的事物。
?那么亞馬遜、亞馬遜云科技是如何看待這三件事的呢?Amazon Bedrock,這是我們用于運行生成式AI模型的托管服務(wù)。亞馬遜正在建立自己的模型。我們從1998年就開始做AI。亞馬遜網(wǎng)站上的個性化就是AI。我們于2017年推出了SageMaker,這是世界上最大的機器學(xué)習(xí)平臺。我們有超過10萬名客戶在SageMaker上進行機器學(xué)習(xí)。然后,如果你想具體討論生成式人工智能和基礎(chǔ)模型,亞馬遜的基礎(chǔ)模型已經(jīng)在生產(chǎn)環(huán)境中運行了幾年。部分零售網(wǎng)站搜索由大型語言模型提供支持。如果你看看Alexa,很多Alexa的語音響應(yīng)都是由LLM提供支持的。我們在這一領(lǐng)域擁有大量專業(yè)知識,并將其專門用于生成人工智能。
?但是,我們還在構(gòu)建我們自己的模型——擴展我們現(xiàn)有的模型并構(gòu)建一些新模型。這些模型都將屬于Titan品牌。這些Titan模型將于今年晚些時候推出。我們認為它們會很棒,而且對于很多客戶來說它們的功能都非常強大。但同樣,沒有一種模式可以統(tǒng)治所有這些。
?我們還與Anthropic建立了良好的合作關(guān)系,他們的模型就在其中,而Stability AI則負責(zé)生成圖像的模型。Cohere剛剛加入了Bedrock、AI21,隨著時間的推移還會有其他人加入。這都是一致的API集。因此,客戶很容易擁有相同類型的框架工具,然后他們只需通過調(diào)用API來使用他們想使用的模型即可。
?我們的方法是提供簡單的實驗和非常廣泛的選擇。這就是第一個概念。
?第二個是關(guān)于安全性……如果您使用Amazon Bedrock中的任何模型,它都與您的所有其他亞馬遜云科技資源位于同一個隔離的私有環(huán)境中。我們將其稱為VPC或虛擬私有云。因此,所有內(nèi)容都是加密的,不會通過公共互聯(lián)網(wǎng)傳播。如果您想使用這些模型之一,我們基本上會在您自己的虛擬私有云中實例化該模型。因此,如果你對模型進行算法改進,他們不會回到母艦來使你的競爭對手受益。這真的很重要。
我們已經(jīng)討論過數(shù)據(jù)平臺,以及如此多的客戶如何讓他們的數(shù)據(jù)平臺真正在亞馬遜云科技上運行,這些客戶需要我們擁有一套強大的生成式AI功能,因為他們知道他們的數(shù)據(jù)在哪里,還必須有他們的生成人工智能。這就是我們?nèi)绾嗡伎伎蛻粜枰覀儤?gòu)建的能力。
?打造自研人工智能芯片
?記者:我的同事給我講過一些故事,初創(chuàng)公司基本上需要亞馬遜云科技的內(nèi)部連接才能讓他們的人工智能應(yīng)用程序上線,因為芯片的瓶頸非常高。您在這里要解決的第一個問題是我們的芯片需要具有競爭力或至少與Nvidia的芯片相當(dāng)嗎?或者是:我們只需要購買更多的Nvidia芯片?
?Adam:我認為世界上每個人都希望有更多的芯片能夠運行這些人工智能工作負載。無論你是誰,你都希望有更多。我認為,至少在短期內(nèi),需求超過供應(yīng),這一點毫無爭議,對每個人來說都是如此。
?記者:這是您正在積極致力于的事情嗎?世界上沒有足夠的計算機或芯片來應(yīng)對人工智能的市場機會。這是問題所在嗎?
?Adam:我們運行大量的Nvidia GPU ——同樣,我們是世界上最大的、也許是最大的GPU主機之一。客戶正在搶購它們,它們被稱為我們的P5實例??蛻衄F(xiàn)在正在生產(chǎn)中使用我們的P5實例。我們肯定會在未來幾周和幾個月內(nèi)引入更多的產(chǎn)能。我們將繼續(xù)托管大量基于GPU的實例。
?我們將成為一個非常重要的云托管服務(wù)商。此外,我們認為供應(yīng)滿足客戶的需求非常重要,當(dāng)然還要具有性價比和節(jié)能性,因此我們擁有自己設(shè)計的芯片,而不是GPU。我們之前討論過我們的Trainium芯片,而Trainium 1已經(jīng)上市一段時間了。Trainium的未來版本也可能會出現(xiàn)。
?記者:你把這個數(shù)字寫在名字里。很容易猜測可能會有下一個數(shù)字。
?Adam:是的,完全正確。與市場上任何其他替代方案相比,Trainium為大量機器學(xué)習(xí)用例提供了出色的性價比。而且它只會不斷改進。同樣,對于我們所有的芯片,例如,我們的Graviton3芯片的能效比同等的基于x86的芯片高出60%。同樣,對于我們用于機器學(xué)習(xí)和人工智能的Trainium和Inferentia芯片,我們將非常非常注重能耗,這對我們的客戶來說確實非常重要。因此,我認為亞馬遜云科技能夠為我們的客戶提供整個獨立的供應(yīng)鏈,這對于我們的客戶來說非常有用且必要。我的意思是,你不可能只擁有一個全世界都依賴的供應(yīng)鏈,而且可能會出現(xiàn)各種短缺和意想不到的事情發(fā)生。
?記者:您是否預(yù)見到這樣一個世界:您選擇一個模型,并將該模型與某種亞馬遜專有芯片配對,從而成為差異化因素?
?Adam:這是一個很好的問題。我想說,很多模型都會選擇在多個芯片上運行,并且他們這樣做是有充分理由的。但我確實認為,您會看到某些模型提供商確實與亞馬遜云科技等公司非常接近,并說:“嘿,讓我們一起優(yōu)化。讓我們確保該模型既能推動芯片的改進,又能利用該芯片的獨特特性?!币虼?,他們可能會選擇不成比例地(或者在某些情況下可能完全)專注于一種芯片,因為這種專注具有顯著的優(yōu)勢。但我也很確定您會看到很多模型在很多不同的芯片上運行。
?這就是芯片方面。我認為我們?yōu)榭蛻籼峁┑木薮髢?yōu)勢,特別是那些正在構(gòu)建模型的客戶,是這個完全獨立的供應(yīng)鏈,這個由亞馬遜設(shè)計的芯片構(gòu)成的完全獨立的一整套能力。所以我認為芯片是一個很大的限制。另一個很大的限制是電力。我認為眾所周知,在世界上許多重要地點,計算能力的需求增長得如此之快,以至于不清楚在這些地點是否有足夠的電力來為這些數(shù)據(jù)中心、服務(wù)器和芯片供電。我們正在全球范圍內(nèi)非常謹慎但積極地建設(shè)新的電力能力,這些地方我們認為有豐富的電力——清潔能源——因為到2025年,我們將在整個公司范圍內(nèi)實現(xiàn)100%的可再生能源,這就在不遠的將來了。今天我們90%由可再生能源供電。所以我認為,在全球范圍內(nèi)建立整個芯片供應(yīng)鏈,然后在美國以及其他國家的一些地方建立電力和數(shù)據(jù)中心容量,這些地方確實有意義,確實有發(fā)展前景,將成為我們提供所有這些客戶所需求供應(yīng)的關(guān)鍵。
?
?構(gòu)建負責(zé)任的人工智能
?記者:亞馬遜非常大——它只是一個非常大的公司。它涉足很多事情。最值得注意的是,它運營著一個巨大的電影工作室和流媒體服務(wù),這些服務(wù)涉及到很多關(guān)于AI、藝術(shù)和版權(quán)法律等問題。亞馬遜云科技是一些數(shù)據(jù)托管的地方。這里是一些模型被訓(xùn)練的地方。你作為基礎(chǔ)設(shè)施提供商是否考慮過這個問題?有一系列關(guān)于公平使用的版權(quán)法律問題即將出現(xiàn),也許Stability會因為Getty而陷入麻煩?;蛘逜nthropic會因為Reddit數(shù)據(jù)爬取而陷入麻煩,或者未來可能發(fā)生的任何事情。作為基礎(chǔ)設(shè)施提供商,我們有一定的責(zé)任來調(diào)解這個問題,因為我們在亞馬遜云科技這邊所做的事情可能會讓Prime Video在那邊與演員和編劇產(chǎn)生麻煩。
?Adam:亞馬遜云科技非常關(guān)注負責(zé)任的AI和隱私以及所有倫理、監(jiān)管和立法問題,這些問題都得到了適當(dāng)?shù)挠懻摗T趤嗰R遜云科技,我們不會因為Prime Video或任何其他內(nèi)部客戶而考慮任何獨特的事情,就像我們在亞馬遜云科技做的其他所有事情一樣,亞馬遜是一個偉大的客戶,一個非常大的客戶,一個復(fù)雜的客戶,他們經(jīng)常是其他復(fù)雜企業(yè)要走向何方的很好的風(fēng)向標(biāo)。但他們沒有特殊待遇。
?記者:我不是在談?wù)搧嗰R遜本身,而是說亞馬遜作為一個公司制造藝術(shù)品。這對于亞馬遜這樣規(guī)模的科技公司來說是非常了不起的,就像它完全投資于制造藝術(shù)品。在創(chuàng)意社區(qū)中引起騷動的一件事是生成式AI:誰獲得數(shù)據(jù),誰擁有數(shù)據(jù),是否公平使用數(shù)據(jù)進行訓(xùn)練。然后,在亞馬遜的另一側(cè),你正在制造使這一切成為可能的工具。我只是想知道你個人作為負責(zé)這些工具的人,是否曾經(jīng)剎車并說:“我們不知道這些問題的答案。一,我們可能只是讓我們在Prime Video的朋友陷入麻煩。二,更重要的是,更直接的是,我們可能正在進入一個責(zé)任世界,因為我們已經(jīng)讓Stability去訓(xùn)練Getty的圖像?!?/p>
?Adam:我們不會踩剎車,但我們正在努力解決所有這些問題。一系列非常巨大和復(fù)雜的問題還處于早期階段。這個問題不會在一夜之間得到解決,但現(xiàn)在就著手解決這些問題非常重要。
?順便說一句,我們不會自己解決這個問題。我們將努力成為所有這些問題的主導(dǎo)聲音,但從本質(zhì)上講,我們無法自己解決這個問題。我們討論了亞馬遜正在構(gòu)建的Titan模型,并且我們在用于訓(xùn)練模型的數(shù)據(jù)方面,非常認真地對待負責(zé)任的人工智能。減少諸如毒性之類的東西。準確性非常重要,因為關(guān)于模型中的幻覺有很多適當(dāng)?shù)挠懻摗旧夏P徒o你的結(jié)果不是真實的,或者它們是編造的,但它們看起來像是真的。
?我們投入了大量的工作來最大限度地減少模型中可能發(fā)生的幻覺數(shù)量,并且還采用了各種交叉檢查方法。因此,該模型可以判斷它是否本質(zhì)上是在編造一些東西,以便對您有所幫助。所以我認為這些模型將在準確性、毒性和適當(dāng)?shù)挠?xùn)練方面有一些真正的創(chuàng)新。其中很多內(nèi)容將以積極的方式進入Amazon Bedrock。因此,我們將擁有Titan模型,但也有其他模型提供商。我們正在制作一種叫做服務(wù)卡的東西。人們一直在討論希望了解這些模型的內(nèi)容、誰訓(xùn)練了這些模型以及使用了哪些類型的數(shù)據(jù)。
?因此,我們正在為每個模型制作這些服務(wù)卡,并且我們希望為Bedrock內(nèi)部的所有模型提供這些服務(wù)卡,它將提供有關(guān)該模型是什么的基本基本信息,并且至少在高級別上,使用什么類型的數(shù)據(jù)來訓(xùn)練它以及它的預(yù)期用途和限制是什么。我并不認為這會解決透明度、解決可見性問題,但至少在2023年,這是我們朝著正確方向邁出的一步。然后,在立法和監(jiān)管方面,我認為我們需要成為許多重要聲音之一。我們花了很多時間與政府、議員、歐洲和世界其他國家的類似機構(gòu)打交道。
?記者:您認為這對您來說更像是一個應(yīng)用程序商店模式嗎?那么,您是否檢查過以確保Meta的模型不會以比其他人更高的速度產(chǎn)生幻覺?
?Adam:我們不能那樣做。我們不擁有該模型。因此,如果客戶過來說:“嘿,SageMaker是一個很棒的機器學(xué)習(xí)平臺,我們希望在SageMaker中運行LLaMA。”我們不會說不,我們也不會成為LLaMA的世界專家。我們將對我們的模型負責(zé)。歸根結(jié)底,模型提供商需要承擔(dān)責(zé)任。政府需要決定在多大程度上希望立法規(guī)定其責(zé)任。并且需要提供可見性,以便潛在客戶可以決定這些模型是否適合他們。
?記者:如果你通過了一項法律,規(guī)定模型不能做X,我們必須弄清楚誰來執(zhí)行這一點。答案之一是像亞馬遜云科技這樣的基礎(chǔ)設(shè)施提供商,對嗎?
?Adam:我們有一個可接受的使用政策。當(dāng)發(fā)生一些重要的事情時,我們會決定改變它。我們不經(jīng)常這樣做,但這是一個不斷發(fā)展的事情。我們執(zhí)行它,其中包括人工智能。因此,如果我們明天需要更改與人工智能相關(guān)的內(nèi)容,我們明天就會更改。人工智能將具有獨特的特征,但本質(zhì)上并沒有不同。但我認為政府會決定模型的一定規(guī)?;驈?fù)雜程度。
?人們正在談?wù)撉把啬P?。也許我們必須確保它們經(jīng)過了獨立的毒性測試和紅隊測試之類的測試。我們非常重視這樣的事情。例如,CodeWhisperer是我們構(gòu)建的一個很棒的編碼助手。你輸入單詞,它會給你返回代碼。這太神奇了。但是在代碼中,我們構(gòu)建了自動能力,使模型能夠告訴你,如果你使用開源代碼之類的東西,可能正在使用的開源代碼的許可條款和治理是什么,以及過濾掉任何與毒性有關(guān)的東西。因此,對于我們控制的服務(wù),我們非常認真地對待它,并嘗試構(gòu)建這些控件,這些控件不僅在倫理上很重要,而且在許多情況下在法律上也很重要,對于我們的客戶來說也是如此。