以技術(shù)驅(qū)動(dòng)創(chuàng)新,以芯力量擁抱數(shù)智未來(lái)。平頭哥《芯事》訪談對(duì)話科技創(chuàng)新者、引領(lǐng)者,探索創(chuàng)芯之路,共建硬核算力,賦能科技創(chuàng)新。
本期《芯事》人物:致凡 —— 阿里云視頻云技術(shù)團(tuán)隊(duì)負(fù)責(zé)人
視頻云和倚天710的結(jié)合是一段美好的旅程
2022年北京冬奧會(huì),阿里云承接了一項(xiàng)重要的任務(wù),那就是支撐冬奧全面上云。為此,阿里云視頻云推出了全新的云上創(chuàng)新解決方案——阿里云聚“Alibaba Cloud ME”,這也是全球第一次在奧運(yùn)會(huì)上實(shí)現(xiàn)異地全息會(huì)面,是一次打破時(shí)空之距的革命性創(chuàng)新。
在感嘆云上沉浸之旅的精妙之余,我們不禁要問(wèn),阿里云視頻云上路即狂奔的硬實(shí)力是什么?除了使命必達(dá)的奮斗精神和強(qiáng)大的軟件、算法支撐能力以外,阿里云視頻云總經(jīng)理致凡還提到了倚天710。
當(dāng)我們將目光投射到倚天710上,會(huì)發(fā)現(xiàn)它誕生于2021年,是一款由平頭哥自研的云芯片,經(jīng)過(guò)一年多時(shí)間的硬件部署和業(yè)務(wù)驗(yàn)證,倚天710實(shí)例已成功應(yīng)用到阿里巴巴集團(tuán)的核心業(yè)務(wù)中,并服務(wù)多家知名互聯(lián)網(wǎng)及科技公司。正是基于前期優(yōu)良的表現(xiàn),阿里云在2022年的云棲大會(huì)上宣布:未來(lái)2年,阿里云20%的新增算力將使用自研CPU。
當(dāng)然,沒有一款芯片生來(lái)就如此強(qiáng)大,致凡告訴與非網(wǎng):“視頻和倚天710的結(jié)合是一段美好的旅程,但中間還是經(jīng)歷了非常多的事情?!?/p>
致凡解釋:“由于視頻業(yè)務(wù)的增長(zhǎng)速度是非常快的,而要研制一顆視頻芯片的周期卻非常長(zhǎng),所以在一開始的時(shí)候大家是抱著試一試的心態(tài),配合來(lái)做這件事。當(dāng)?shù)谝话嫘酒?a class="article-link" target="_blank" href="/tag/%E6%B5%81%E7%89%87/">流片回來(lái)后,沒有做過(guò)任何優(yōu)化跑出來(lái)的性能和速度都跟不上傳統(tǒng)架構(gòu)CPU,但由于Arm架構(gòu)帶來(lái)的原生優(yōu)勢(shì),再加上阿里云和平頭哥的同學(xué)雙方坐在一起,在了解芯片內(nèi)部構(gòu)成的基礎(chǔ)上去做了很多算法調(diào)優(yōu)后,能夠讓代碼在芯片上跑得更快。同時(shí),倚天710還針對(duì)特定算法場(chǎng)景進(jìn)行了指令集加速與優(yōu)化,比如像SVE等矢量計(jì)算技術(shù),其中BF16/INT8 mmla指令可實(shí)現(xiàn)高效的矩陣乘法運(yùn)算,還支持Hash、CRC32等加速指令,可以讓單條指令并行處理更多數(shù)據(jù),大幅提升視頻編解碼、AI編解碼增強(qiáng)等場(chǎng)景性能,這是一個(gè)兩邊一起迭代的過(guò)程?!?/p>
所以,從最早的性能不如傳統(tǒng)架構(gòu)CPU,到現(xiàn)在已經(jīng)遠(yuǎn)遠(yuǎn)的超過(guò)傳統(tǒng)架構(gòu)CPU,倚天710的“蛻變”是一步一個(gè)腳印走過(guò)來(lái)的。致凡認(rèn)為:“這是一個(gè)非常好的案例,阿里視頻云的業(yè)務(wù)跟平頭哥的芯片設(shè)計(jì)能夠完美地結(jié)合在一起,利用各自的優(yōu)勢(shì)讓芯片設(shè)計(jì)出來(lái),在視頻行業(yè)中發(fā)揮更大的作用?!?/p>
談起平頭哥和阿里云視頻云業(yè)務(wù)的這次合作,就不能不提到一個(gè)大的產(chǎn)業(yè)背景,即視頻云的爆發(fā)式增長(zhǎng)。至于什么是視頻云?“視頻云就像是音視頻行業(yè)的水和電,是底層的基礎(chǔ)設(shè)施,可以大大簡(jiǎn)化視頻從采集、處理、編碼、傳輸?shù)椒职l(fā)的鏈路。”致凡形象的比喻再恰當(dāng)不過(guò)。
社會(huì)視頻化是一種大趨勢(shì)
從2017年開始,短視頻的熱度持續(xù)上升,加上近三年疫情下直播、視頻會(huì)議、線上教學(xué)等領(lǐng)域的崛起,社會(huì)視頻化成為一種大趨勢(shì)。
根據(jù)CNNIC發(fā)布的第50次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》數(shù)據(jù)顯示,截至2022年6月,我國(guó)移動(dòng)互聯(lián)網(wǎng)接入流量達(dá)1241億GB,同比增長(zhǎng)20.2%;另根據(jù)思科發(fā)布的數(shù)據(jù)顯示,視頻內(nèi)容約占互聯(lián)網(wǎng)總流量的90%,占移動(dòng)網(wǎng)絡(luò)總流量的64%。
結(jié)合這兩組數(shù)據(jù),我們可以得出視頻正在成為互聯(lián)網(wǎng)流量的主角。而爆炸性的數(shù)據(jù)量又將會(huì)對(duì)算力和存儲(chǔ)提出更大的挑戰(zhàn)。于是視頻云的價(jià)值被凸顯出來(lái),并呈現(xiàn)出了一種不可逆的發(fā)展態(tài)勢(shì)。在這樣的大背景下,全球以互聯(lián)網(wǎng)公司為主的科技企業(yè)紛紛轉(zhuǎn)型,開啟視頻云技術(shù)的探索之旅,并在安防監(jiān)控、遠(yuǎn)程醫(yī)療、零售電商以及金融機(jī)構(gòu)等典型場(chǎng)景中得到落地。
當(dāng)前,視頻云產(chǎn)業(yè)已經(jīng)形成了相對(duì)穩(wěn)定的頭部戰(zhàn)隊(duì),包括國(guó)外的微軟、AWS,以及國(guó)內(nèi)的阿里云、騰訊云、華為云、百度云、金山云、字節(jié)、快手、深網(wǎng)等。
關(guān)于國(guó)內(nèi)視頻云的市場(chǎng)體量方面,根據(jù)IDC發(fā)布的數(shù)據(jù)顯示,2022上半年中國(guó)視頻云市場(chǎng)規(guī)模達(dá)到50.5億美元,同比增長(zhǎng)15.7%,預(yù)計(jì)到2026年,市場(chǎng)規(guī)模接近300億美元。值得一提的是,該報(bào)告同時(shí)還指出,阿里視頻云連續(xù)4年蟬聯(lián)中國(guó)視頻市場(chǎng)份額第一,并且滲透率還在不斷增加。
視頻產(chǎn)業(yè)發(fā)展迅猛,倒逼技術(shù)快速迭代
對(duì)于視頻云產(chǎn)業(yè)來(lái)講,以在線視頻為例,從最早國(guó)外的Livestream、國(guó)內(nèi)的斗魚直播到現(xiàn)在已經(jīng)經(jīng)歷了25年的歷史,其實(shí)從技術(shù)的角度來(lái)看,整個(gè)行業(yè)發(fā)展的速度沒有想象中的快。比如,視頻編碼從H.264到H.265,再到H.266,平均10年升級(jí)一代。為什么速度不是很快?因?yàn)樗鉀Q的問(wèn)題比較多:算力、網(wǎng)絡(luò)傳輸、標(biāo)準(zhǔn)等等。
但是,我們看到今天的視頻產(chǎn)業(yè)發(fā)展非常迅猛,這也倒逼技術(shù)要去完成快速迭代。這幾年已經(jīng)初顯效果,比如現(xiàn)在編碼器的升級(jí)迭代速度是5年,以前是10年,預(yù)計(jì)后面可能是3年。
為什么這里要強(qiáng)調(diào)編碼?事實(shí)上,視頻云是一個(gè)算力密集型行業(yè),視頻信息量很大,假如采用和文本、圖片一樣的壓縮模式,那么還原度是不夠的,所以視頻必須進(jìn)行編碼處理。編碼要是做不好,不僅會(huì)損失視頻質(zhì)量,還會(huì)帶來(lái)傳輸難度高的問(wèn)題。
從MPEG2開始,每一代視頻編碼的升級(jí),其壓縮率大約可以提升50%,遠(yuǎn)低于視頻分辨率每更新一代提升4倍的速度,即使這樣,每一代升級(jí)對(duì)CPU算力的需求,以及算法復(fù)雜度都會(huì)提高至少10倍以上,這對(duì)芯片的架構(gòu)、芯片底層的指令集優(yōu)化、芯片的存儲(chǔ)器和CASH結(jié)構(gòu)都會(huì)帶來(lái)新的挑戰(zhàn),很多核心的算法要用新的指令集重新寫一遍,這意味著視頻編碼和芯片成長(zhǎng)是需要同步的。
視頻云需要怎樣的CPU?
通過(guò)前面的介紹,我們了解到視頻編碼對(duì)算力的要求很高,因?yàn)槲覀兂3T噲D用算力換存儲(chǔ),用算力換傳輸帶寬,所以我們希望算力越高越好。
那么如何提升CPU的算力?首先要選擇好的內(nèi)核架構(gòu)。在視頻領(lǐng)域,傳統(tǒng)架構(gòu)已經(jīng)有三十幾年的歷史了,目前市占率依然能達(dá)到90%以上的份額,但裹挾著沉重的向后兼容包袱。而Arm作為一種精簡(jiǎn)指令集,不僅沒有歷史包袱,還可以根據(jù)需求增加很多寄存器,同時(shí)從內(nèi)存CASH結(jié)構(gòu)的設(shè)計(jì)和指令集的設(shè)計(jì)上面,能夠更貼合需要大算力的視頻處理需求。
此外,不管是Hyper-Threading還是其他,采用傳統(tǒng)架構(gòu)的CPU走的都是提高主頻的路子,在視頻處理時(shí)就會(huì)遇到一些問(wèn)題,比如視頻壓縮的時(shí)候會(huì)分成I幀、P幀、B幀,每一幀的算力并不是平均分配的,就會(huì)帶來(lái)對(duì)算力需求不穩(wěn)定的問(wèn)題。所以為了讓芯片不跑超頻,就可能會(huì)做一些降頻處理,這時(shí)候它的算力就可能達(dá)不到相應(yīng)的編碼需求。在實(shí)際業(yè)務(wù)中,由于視頻業(yè)務(wù)不是單機(jī)運(yùn)行的,會(huì)有很多的服務(wù)器集群配合來(lái)處理,為了防止CPU跑超等復(fù)雜情況的出現(xiàn),就不得不把服務(wù)器集群的水位降低,這是傳統(tǒng)架構(gòu)CPU比較大的問(wèn)題。
然而Arm整體的設(shè)計(jì)是比較穩(wěn)定的,不管任務(wù)有多復(fù)雜,都能實(shí)現(xiàn)穩(wěn)定輸出,做到良好的資源調(diào)配和水位調(diào)配,不用預(yù)留很多冗余來(lái)防止芯片跑超,這對(duì)于to B業(yè)務(wù)來(lái)說(shuō)非常重要。
除了主頻高以外,傳統(tǒng)架構(gòu)CPU的核不多,通常是兩個(gè)vCPU/HT共享一個(gè)物理核、1份ALU,但Arm可以實(shí)現(xiàn)128/256/512或更多的核,類似GPU的設(shè)計(jì),如此一來(lái),對(duì)于不同應(yīng)用場(chǎng)景而言,就可以用少核應(yīng)對(duì)低算力需求的場(chǎng)景,多核應(yīng)對(duì)高算力需求的場(chǎng)景,實(shí)現(xiàn)更優(yōu)的業(yè)務(wù)調(diào)配,降低投入成本。以倚天710為例,它采用了ARMv9架構(gòu),內(nèi)含128核CPU,主頻最高可達(dá)3.2GHz,可適配云的不同應(yīng)用場(chǎng)景。
與此同時(shí),隨著數(shù)據(jù)上云越來(lái)越多,對(duì)于數(shù)據(jù)中心而言,功耗性能也是非常重要的,對(duì)運(yùn)營(yíng)者來(lái)說(shuō),低功耗就意味著低成本,在這方面,Arm相比于傳統(tǒng)架構(gòu)也有著獨(dú)特優(yōu)勢(shì)。這也是除了軟件層面的優(yōu)化以外,為什么倚天710能同時(shí)兼顧性能和功耗的重要原因之一。
以上要素疊加,就讓視頻云的頭部企業(yè)阿里云與倚天710 的結(jié)合看起來(lái)水到渠成。當(dāng)前,倚天710已大規(guī)模部署并提供云上服務(wù),根據(jù)實(shí)踐反饋,倚天710讓阿里云平臺(tái)的算力性價(jià)比提升了超30%,單位算力功耗降低了60%,這是一個(gè)相當(dāng)大的進(jìn)步。
寫在最后
縱觀視頻云產(chǎn)業(yè),人們對(duì)體驗(yàn)的極致追求,將成為視頻云持續(xù)深耕的動(dòng)力。在云應(yīng)用場(chǎng)景下,CPU的發(fā)展之路將循著算力、I/O、網(wǎng)絡(luò)協(xié)議適配、推理能力、從無(wú)到有的創(chuàng)造能力不斷演進(jìn)下去。
未來(lái),Arm會(huì)成為視頻云中一種重要的架構(gòu),整體份額一定會(huì)增加,但不會(huì)是唯一的架構(gòu),傳統(tǒng)架構(gòu)、異構(gòu)的ASIC和FPGA都會(huì)有一席之地。而對(duì)于Arm架構(gòu)而言,未來(lái)的改進(jìn)方向是降低功耗、提高算力、做好專用性和通用性的選擇平衡。
同時(shí),我們要意識(shí)到,未來(lái)視頻對(duì)算力的挑戰(zhàn)是非常高的,簡(jiǎn)單地靠 CPU的升級(jí)已經(jīng)滿足不了需求,需要一些特殊的處理,包括越來(lái)越多的AI算法、專用算法,比如模型搜索的算法等,再把通用的模塊部分地固化在芯片里面,極大地提升視頻處理的效率。
所以在視頻云市場(chǎng),人們總是在做權(quán)衡,云芯片廠商要處理好芯片能效和通用性的關(guān)系,云服務(wù)商要在算力有限的情況下使用很多快速算法。而正如致凡強(qiáng)調(diào)的:“我們的愿景都是一樣的,就是讓視頻普惠各行各業(yè),從而反哺視頻行業(yè),實(shí)現(xiàn)更茁壯的發(fā)展。