編者按
CDN行業(yè),整體不怎么賺錢。核心原因在于,用戶的業(yè)務(wù)系統(tǒng)構(gòu)建在公有云或自建的私有云。僅僅是調(diào)用CDN資源,對CDN服務(wù)沒有依賴。當有稍微便宜哪怕僅1%的其他CDN資源時,客戶瞬間遷走。智算行業(yè),目前的業(yè)務(wù)模式在無限接近CDN??蛻舻臉I(yè)務(wù)系統(tǒng)部署在通用云計算上,只是在關(guān)鍵的智能計算服務(wù)時,調(diào)度內(nèi)部或外部的智算算力資源。智算中心,無法為客戶提供高價值的服務(wù),無法形成用戶粘性。沒有差異化,唯一能拼的就是誰的價格更低。還有一個更大的風險:智算的投入,相比CDN來說,數(shù)量級倍增。不賺錢,更高投入就意味著更高風險。智算中心行業(yè),未來發(fā)展該往何處去?
1 CDN服務(wù)綜述
1.1 CDN技術(shù)簡介
CDN(Content Delivery Network,內(nèi)容分發(fā)網(wǎng)絡(luò)),使得用戶可就近取得所需內(nèi)容,CDN分擔了內(nèi)容源的訪問壓力,同時提高了用戶訪問網(wǎng)站的響應(yīng)速度。? ?如圖所示,當用戶訪問某個域名地址的內(nèi)容時,內(nèi)容源站發(fā)現(xiàn)是一個cdn地址,然后會給客戶動態(tài)分發(fā)一個新的IP地址,這個地址不是源內(nèi)容的地址,而是用戶就近位置的CDN緩存的內(nèi)容,然后用戶去這個新地址訪問內(nèi)容。
1.2 CDN業(yè)務(wù)模式的問題
CDN服務(wù)的問題,不在服務(wù)機制內(nèi)部。而在于CDN和用戶業(yè)務(wù)的交互??蛻舻臉I(yè)務(wù)通常部署在公有云,或者用戶自建的私有云。當需要CDN的時候,會額外購買CDN服務(wù)。CDN服務(wù)有三個特點:
- 一個是業(yè)務(wù)流水大,非常適合于各個CDN企業(yè)快速做大業(yè)務(wù)規(guī)模。為了拉升業(yè)務(wù)規(guī)模,就相互之間以更低的價格競爭客戶。另一個是,CDN業(yè)務(wù)差異性非常小??蛻舨惶舴?wù)商,隨便哪家都可以用;用戶只挑價格。最后就是,CDN服務(wù)對用戶沒有任何粘性。用戶只需一行代碼,即可快速從一個CDN服務(wù)切換到另一個CDN服務(wù)。
也因此,整個行業(yè)瘋狂內(nèi)卷,直到大家都奄奄一息。
2 智算服務(wù)綜述
2.1 智算租賃模式
智算行業(yè),目前主要是以裸機租賃的方式。裸機租賃是一個比較初級的方式,數(shù)百萬購買的硬件設(shè)備,其價值的挖掘不是由算力中心側(cè)負責。而是直接就租賃給了客戶。有點像石油、礦產(chǎn)等原材料,沒有通過深加工把它煉化成初級工業(yè)品。在整個工業(yè)鏈條里分利太少,白白浪費了寶貴的原材料。GPU服務(wù)器,就是智算行業(yè)的原材料,它需要經(jīng)過深加工,把它封裝成更高級的算力服務(wù),才能賺取更多的收益。
這里我們舉一個例子,假設(shè)一些量化的數(shù)據(jù),來簡單解釋一下。假設(shè)一個12核CPU(C)和一個12G帶寬的網(wǎng)卡(N)組成的物理服務(wù)器(僅考慮CPU和網(wǎng)絡(luò),問題能簡單一點,已經(jīng)能夠說明問題)。如上圖,我們通過四種方式實現(xiàn)多種規(guī)格的算力:
- 假設(shè)這臺服務(wù)器成本為10元。第一種,傳統(tǒng)算力租賃方式。完全物理的服務(wù)器,僅可售賣一臺服務(wù)器,同時假設(shè)一對C+N為1元,總共賣客戶12元。
- 第二種,基本虛擬化。可以實現(xiàn)算力切分,這樣,我們可以把一臺物理的機器切分成四臺虛擬的機器,可售賣4臺計算實例。跟第一種其實就是批發(fā)和零售的關(guān)系。賣四臺,每對C+N賣1.5元,可以賣18元。
- 第三種,精細虛擬化。不同的計算對各類資源的需求并不是完全對等的,可以針對需求分配多一些的某種資源,其他需求少的資源可以少分配一些。這樣,我們可以把一臺物理的機器切分成6臺虛擬的機器,可售賣的機器實例變成6個??蛻魞H關(guān)注某個資源,我們把1對C+N賣1.5元,把額外的C或N賣1元,這樣算下來,就是21元。
- 第四種,軟硬件協(xié)同優(yōu)化。通過硬件級的性能隔離、更高效的遷移調(diào)度,能夠?qū)崿F(xiàn)用戶業(yè)務(wù)無感情況下的超賣,這樣可售賣的機器數(shù)量會繼續(xù)增加。通過高效的調(diào)度,保守估計,超售比可以做到1.2以上。這樣,21*1.5 = 31.5元。
成本10塊,最終可以賣到31.5元。當然,我們可以把這些可能的收益反向降價讓利給用戶。因為跟裸機租賃相比,有非常大的降價空間,所以可以游刃有余的根據(jù)市場情況,既給客戶更低的成本,又能保持自己產(chǎn)品的競爭力。這里舉例的僅僅是IaaS級的服務(wù),還沒有增加CaaS、PaaS、MaaS以及場景和行業(yè)解決方案等方面的價值?;仡^再看裸機租賃方式,是不是有點暴殄天物?
2.2 智算算力調(diào)度
開門見山,直接說個人的看法。我覺得目前的智算算力調(diào)度走進了一個誤區(qū)。目前的算力調(diào)度機制來源于HPC場景的調(diào)度機制。也就是這種短期任務(wù)的調(diào)度(關(guān)于算力調(diào)度,之前有專門的文章介紹,這里不展開),跟客戶業(yè)務(wù)系統(tǒng)常駐型的任務(wù)調(diào)度完全不同。Slurm系統(tǒng)來源于HPC場景,天然就是原生支持這種短期任務(wù)型的計算。K8S,本來是親和于常駐型計算任務(wù)的,但行業(yè)我了解到的情況是,智算目前基于K8S的管理系統(tǒng),也是以這種短期任務(wù)為主的。這樣就產(chǎn)生一個非常尷尬的現(xiàn)實。用戶的業(yè)務(wù)系統(tǒng),通常需要長期處于運行狀態(tài)的:C端的業(yè)務(wù)必然是7x24小時時刻不中斷, B端用戶的業(yè)務(wù)也大部分需要長期穩(wěn)定運行。這樣,客戶的業(yè)務(wù)系統(tǒng)就只能部署在公有云或用戶自建的私有云,而無法部署在智算中心。
2.3 智算業(yè)務(wù)模式,越來越像CDN
客戶的業(yè)務(wù)系統(tǒng)不在智算中心,在需要訓(xùn)練和推理的時候,才來訪問智算中心。智算中心,無法對客戶形成業(yè)務(wù)粘性;智算中心的業(yè)務(wù)模式是裸機租賃,同質(zhì)化嚴重,大家都只能陷入爭相殺價的內(nèi)卷。有沒有覺得,這跟CDN很像?CDN的現(xiàn)在,就是智算行業(yè)的未來。相比CDN行業(yè)來說,智算行業(yè)的投入,是天文數(shù)字。智算行業(yè)的問題只會更嚴重。往小了說,會影響行業(yè)中從投資人到從業(yè)者的收益。往大了說,會影響我國的人工智能事業(yè)發(fā)展。
3 智算行業(yè),未來往何處去?
不能僅提出問題,還應(yīng)盡可能給出可行的能夠解決問題的方案。智算行業(yè),未來往何處去?是向下,還是向上?向下,就是不斷的卷價格,“不是你死,就是我亡”,行業(yè)進入一個低層次的持續(xù)內(nèi)卷。向上,就是不斷的卷技術(shù),卷服務(wù),給客戶提供更多精細化的增值服務(wù)。向下,我無話可說。向上,我可以展開聊聊:
- 智算,不僅僅只是智算。圍繞著智算的場景,把智算和傳統(tǒng)通算,以及網(wǎng)絡(luò)、存儲、安全等方面的服務(wù)融合到一起,形成綜合全面的算力服務(wù)。整個服務(wù)堆棧,不斷向上。在裸機之上,封裝IaaS和CaaS,再疊加PaaS和MaaS。還需要針對業(yè)務(wù)場景,提供更多的以AI+為特色的場景和行業(yè)解決方案。