以“新算力 新賦能 新未來”為主題的2022 CCF全國高性能計(jì)算學(xué)術(shù)年會(huì)(CCF HPC China 2022)在線上正式召開。作為高性能計(jì)算領(lǐng)域全球最具影響力的三大超算盛會(huì)之一,大會(huì)邀請到2021年圖靈獎(jiǎng)獲得者Jack Dongarra,中國科學(xué)院院士陳國良、錢德沛,中國工程院院士陳左寧、孫凝暉、王軍成,加拿大工程院院士K. Nandakumar等業(yè)界專家齊聚一堂,共話超算新趨勢。
12月15日上午,由張先軼博士主持的第二屆異構(gòu)計(jì)算軟件棧與應(yīng)用論壇成功召開。
演講嘉賓們奉獻(xiàn)了精彩的報(bào)告,如下是各報(bào)告的摘要。
報(bào)告主題:異構(gòu)計(jì)算軟件棧的國產(chǎn)自主與國際化愿景
講者簡介
張先軼,算力軟件棧領(lǐng)軍人物。本科和碩士畢業(yè)于北京理工大學(xué),博士畢業(yè)于中國科學(xué)院大學(xué),之后分別在UT Austin和MIT進(jìn)行博士后研究工作。ACM SIGHPC China執(zhí)行委員,CCF高性能計(jì)算專委會(huì)委員。曾榮獲中國計(jì)算機(jī)學(xué)會(huì)科學(xué)技術(shù)獎(jiǎng),中國科學(xué)院杰出科技成就獎(jiǎng)。國際知名開源矩陣計(jì)算項(xiàng)目OpenBLAS發(fā)起人和主要維護(hù)者。
報(bào)告摘要:介紹了高性能計(jì)算的軟硬件體系和發(fā)展概況,結(jié)合澎峰科技的算力基礎(chǔ)軟件棧PerfMPL(數(shù)學(xué)計(jì)算庫)、PerfXAPI(異構(gòu)計(jì)算軟件棧)和PerfXPy(新一代科學(xué)計(jì)算工具),介紹了如何通過開源創(chuàng)新實(shí)現(xiàn)共建算力生態(tài)的目標(biāo),以及立足國內(nèi),走向國際的發(fā)展愿景。
報(bào)告主題:面向天河新一代的異構(gòu)并行應(yīng)用開發(fā)
講者簡介
龔春葉,博士,國防科技大學(xué)計(jì)算機(jī)學(xué)院副研究員,應(yīng)用教研室主任,主任設(shè)計(jì)師,天河高性能并行應(yīng)用方向負(fù)責(zé)人。長期從事高性能并行計(jì)算研究,包括網(wǎng)格生成、密碼分析及CFD并行計(jì)算等卡脖子技術(shù)。發(fā)表論文二十余篇,獲省科技進(jìn)步獎(jiǎng)一等獎(jiǎng)1項(xiàng)。
報(bào)告摘要:介紹了MT-DSP體系結(jié)構(gòu),hThreads并行編程模型。結(jié)合密碼破譯、復(fù)雜城市風(fēng)場模擬、慣性約束聚變等離子體不穩(wěn)定性數(shù)值模擬等典型應(yīng)用分享了軟硬融合的算法加速研究成果,提出異構(gòu)程序性能優(yōu)化五大準(zhǔn)則,和算力生態(tài)的展望。
報(bào)告主題:華為高性能數(shù)學(xué)庫建設(shè)進(jìn)展
講者簡介
李志豪,工學(xué)博士,主要研究方向?yàn)楦咝阅苡?jì)算。他于2015~2021年于中科院計(jì)算所攻讀博士學(xué)位,現(xiàn)就職于華為公司2021實(shí)驗(yàn)室。攻讀博士期間發(fā)表高性能計(jì)算領(lǐng)域高水平論文,如IEEE TPDS、SC、JPDC、ICAPDS、HPCC和計(jì)算機(jī)學(xué)報(bào)等,申請發(fā)明專利多項(xiàng)。曾獲中國科學(xué)院院長優(yōu)秀獎(jiǎng),中科院計(jì)算所所長特別獎(jiǎng),ACM SIGHPC China優(yōu)博獎(jiǎng)等榮譽(yù)。
報(bào)告摘要:數(shù)學(xué)庫是使能處理器在數(shù)值計(jì)算領(lǐng)域的基礎(chǔ)軟件庫,是發(fā)揮硬件算力的基石,目前常用函數(shù)大約有一萬個(gè)。介紹了華為在數(shù)學(xué)庫的建設(shè)進(jìn)展,并結(jié)合電路仿真、電磁仿真、網(wǎng)絡(luò)自治關(guān)鍵算法、語音識(shí)別、加密水印、OCR等應(yīng)用場景,展示了高性能數(shù)學(xué)庫在應(yīng)用領(lǐng)域的加速效果。
報(bào)告主題:EasyView: Enabling and Scheduling Tensor Views in Deep Learning Compilers
講者簡介
蔣麗娟,2020年于中國科學(xué)院軟件研究所并行軟件與計(jì)算科學(xué)實(shí)驗(yàn)室獲得博士學(xué)位,博士期間主要從事國產(chǎn)眾核平臺(tái)上高性能數(shù)學(xué)庫以及基準(zhǔn)測試程序HPCG的深度優(yōu)化工作,畢業(yè)之后主要從事深度學(xué)習(xí)編譯器方面的學(xué)習(xí)研究,在ICPP、TACO等會(huì)議以及期刊上發(fā)表多篇文章。
報(bào)告摘要:訪存密集型算子子圖在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理中占據(jù)了越來越多的時(shí)間比例,基于在線編譯的自動(dòng)算子融合技術(shù)被證明是一種優(yōu)化該類子圖有效的手段。介紹了針對在網(wǎng)絡(luò)實(shí)現(xiàn)中高頻出現(xiàn)的tensor view類算子的端到端在線編譯自動(dòng)融合方法,包含view lowering,內(nèi)存活動(dòng)追蹤,讀寫關(guān)系一致的算子拓?fù)湫蛄蝎@取,以及計(jì)算內(nèi)存優(yōu)化策略等內(nèi)容。
報(bào)告主題:面向異構(gòu)加速器的自適應(yīng)精度模擬
講者簡介
馬子軒,清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系在讀博士生。2019年本科畢業(yè)于清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系。主要研究方向?yàn)楦咝阅苡?jì)算、異構(gòu)程序優(yōu)化、編譯優(yōu)化等。相關(guān)研究成果發(fā)表于PPoPP、ICS、OSDI、SIGMOD、SC等國際會(huì)議。
報(bào)告摘要:是否有可能利用異構(gòu)加速器針對低精度類型的高效計(jì)算能力, 加速高精度類型的計(jì)算負(fù)載? 講者提出了APE,一個(gè)BLAS-like的數(shù)學(xué)庫,支持在不同異構(gòu)加速器上利用低精度類型加速高精度計(jì)算,并設(shè)計(jì)了一種數(shù)據(jù)相關(guān)的自適應(yīng)方法。在NVIDIA GPU上的實(shí)驗(yàn)表明,APE可以有效加速矩陣乘法3.12x,和多種應(yīng)用達(dá)到1.78x的加速性能。
感謝各位老師的精彩報(bào)告!