李國杰:欲窮千里目,更上一層樓
計算機體系結(jié)構(gòu)國家重點實驗室成立10年了,這是這是一個值得慶祝的日子,也是一個值得總結(jié)反思的日子,我寫幾點意見與大家共勉。
2011年計算機體系結(jié)構(gòu)國家重點實驗室成立,2017年國家重點實驗室評估中評為“優(yōu)秀”實驗室,這是20年來信息領(lǐng)域唯一一家首次評估就獲得優(yōu)秀的國家重點實驗室,我們起了一個好頭?,F(xiàn)在體系結(jié)構(gòu)國重有44位研究員,幾乎占到計算所研究員的半壁江山,計算所許多“名人”都是國重的成員,體系結(jié)構(gòu)國重理應(yīng)做出更大的貢獻。
在過去的十年里,體系結(jié)構(gòu)國重做出了一些有世界影響的成果。影響最大的可能是寒武紀芯片,被《科學(xué)》雜志評價為深度學(xué)習(xí)處理器芯片方向的“先驅(qū)”和“領(lǐng)導(dǎo)者”。“一生一芯”計劃已經(jīng)進行到第三期,覆蓋了151所高校(海外20所),在推進基于RISC-V的敏捷芯片設(shè)計方面已受到了全世界的關(guān)注。成立之初設(shè)定的四個主攻方向(高端計算體系結(jié)構(gòu)、微體系結(jié)構(gòu)、編譯與編程、超大規(guī)模集成電路與容錯計算)都做出了出色的成績,在幾位年輕的領(lǐng)軍人才的帶領(lǐng)下,已經(jīng)分蘗出新的科研實體,分別成立了智能處理器研究中心、高性能計算機研究中心、高通量計算機研究中心、先進計算機系統(tǒng)研究中心、智能計算機研究中心,并以此為基礎(chǔ)正在申請成立兩個新的國家重點實驗室(處理器芯片國重和先進計算基礎(chǔ)設(shè)施國重)。十年前比較薄弱的非傳統(tǒng)體系結(jié)構(gòu)方向如今也開出了引人注目的花朵:蛋白質(zhì)序列鑒定及結(jié)構(gòu)預(yù)測已取得進入國際前列的成果,量子計算已集聚一定的實力,正在努力擴充隊伍,DNA存儲、光子計算、超導(dǎo)計算也做出了令人欣喜的初步成果。
總的來講,計算機體系結(jié)構(gòu)國重部署的研究方向已經(jīng)足夠?qū)掗?,國際上與這一領(lǐng)域有關(guān)的研究方向我們幾乎都已涉及。如何組織和協(xié)調(diào)各個研究方向的研究力量,根據(jù)問題導(dǎo)向和目標導(dǎo)向的原則,圍繞國家和產(chǎn)業(yè)的重大需求,做出更有影響的重大成果,值得每一位國重員工認真思考。
通觀計算機發(fā)展的歷史,體系結(jié)構(gòu)和芯片的進步各自為計算機性能的提升做出了一半左右的貢獻。登納德縮放定律的失效和摩爾定律的放緩,使得芯片很難繼續(xù)做出一半的貢獻。至少在變革性的新器件大規(guī)模進入市場以前,人們把提高計算機性能和能效的希望主要寄托在體系結(jié)構(gòu)的創(chuàng)新上。尤其是對于中國而言,由于半導(dǎo)體工藝技術(shù)與國際先進水平有4代以上的差距,近期內(nèi)解決重要問題的重任也主要落在系統(tǒng)結(jié)構(gòu)科研人員的肩上。國內(nèi)不少人一天到晚盯著半導(dǎo)體工藝上的差距,對解決問題一籌莫展。Patterson教授在他的圖靈獎報告中引用了Shimon Peres的一段話:“如果一個問題無解,那它可能不是一個問題,而是一個事實,我們不需要解決,而是隨著時間的推移來處理?!蔽覈雽?dǎo)體工藝落后的問題只能隨著時間的推移來解決。但是,看似無法解決的工藝技術(shù)差距可以另辟蹊徑,通過體系結(jié)構(gòu)的創(chuàng)新來緩解。今后十年甚至更長的時間內(nèi),正是體系結(jié)構(gòu)科研人員大顯身手的好機會。
體系結(jié)構(gòu)講的是一個體系,而不是單項技術(shù)。每個國家的資源稟賦不同,人文歷史不同,發(fā)展階段不同,采取的技術(shù)體系也應(yīng)該不同。多年以來我們跟隨美國的技術(shù)體系(稱為A體系)。相對而言,美國的工程師少而高價值的市場大,走的是一條高精尖的通用為主的道路。與美國相反,中國的工程師多、場景多、市場規(guī)模大(包括中低端市場)。我們需要重點發(fā)展各個領(lǐng)域的跨層垂直優(yōu)化技術(shù),用適應(yīng)不同場景的加速芯片和系統(tǒng)戰(zhàn)勝曾經(jīng)是主流的通用芯片(稱為C體系)。計算機技術(shù)的普及顯著擴大了市場空間,現(xiàn)在一個領(lǐng)域的市場規(guī)??赡芫拖喈?dāng)于過去覆蓋許多領(lǐng)域的通用市場。最近寒武紀研制的思元270 NPU芯片,執(zhí)行AI任務(wù)的綜合性能功耗價格比是同期NVIDIA通用GPU Tesla V100芯片的10倍以上,這就是特定領(lǐng)域加速芯片的典型案例。場景多了,芯片種類多了,設(shè)計的人員就要多。打破生態(tài)壟斷、降低創(chuàng)新門檻、快速培養(yǎng)芯片和系統(tǒng)架構(gòu)設(shè)計人才成了當(dāng)務(wù)之急。開源是打破技術(shù)壟斷最有效的方式,敏捷設(shè)計是應(yīng)對碎片化應(yīng)用場景的出路。RISC-V可能是構(gòu)建C體系的一條捷徑,值得努力探索。
所謂體系結(jié)構(gòu)研究,與每一個層面的單方向技術(shù)研究不同,需要透徹了解各個層面技術(shù)的聯(lián)系和制約,從上到下實現(xiàn)整體的改進和優(yōu)化。從Patterson教授圖靈獎報告講的Python程序可通過系統(tǒng)優(yōu)化得到6萬倍加速的著名案例可以看出,得到這種加速效果需要程序語言的轉(zhuǎn)換(47倍)、多核處理器并行(7倍)、存儲布局優(yōu)化(20倍)、SIMD硬件擴展(9倍)。獲得6萬倍加速的前提是各層次的優(yōu)化是協(xié)調(diào)的,而不是互相制約和抵消,沒有對體系結(jié)構(gòu)的深入理解,就會此消彼長,得不到理想的效果。過去幾十年,體系結(jié)構(gòu)的研究的重點是CPU芯片、存儲系統(tǒng)、操作系統(tǒng)、編譯系統(tǒng)等各個層次的獨立研究,今后十幾年,特定領(lǐng)域系統(tǒng)結(jié)構(gòu)(DSA)將成為計算機發(fā)展的主流,DSA的優(yōu)勢在于一個領(lǐng)域的縱向整合,這正是Patterson教授講的“計算機體系結(jié)構(gòu)迎來下個黃金時代”的本意。我們在縱向整合方面能做出與“黃金時代”相稱的貢獻嗎?
計算機體系結(jié)構(gòu)研究呈現(xiàn)明顯的否定之否定和螺旋式發(fā)展的規(guī)律。不但集中為主還是分布為主有所謂“合久必分、分久必合”的“三國定律”,橫向分層次發(fā)展和縱向整合、顯式并行和和隱式并行也有周期性的規(guī)律。上世紀80年代以前計算機研究的主流是縱向整合,IBM公司就是垂直整合的典范。90年代以后,英特爾和微軟公司的興起促使各個層次的橫向發(fā)展成為主流?,F(xiàn)在又到了縱向垂直整合為主流的時代。早期的并行處理大多是靠人工實現(xiàn)的顯示處理,過去二三十年發(fā)展了很多減輕程序員負擔(dān)的自動并行處理技術(shù)。由于降低能耗成為主要的技術(shù)追求,而程序員和編譯器靜態(tài)分配存儲比動態(tài)分配的高速緩存使用更少的能量,目前流行的DSA處理器又更多地考慮顯式并行。我們既要順勢而為,又要從更高的視角洞察體系結(jié)構(gòu)主流發(fā)展的宏觀規(guī)律。
從IBM 360創(chuàng)立了兼容的計算機系統(tǒng)概念以來,計算機體系結(jié)構(gòu)研究一直是計算機領(lǐng)域的主要研究方向。根據(jù)我的印象,計算機系體系結(jié)構(gòu)研究曾經(jīng)有過火熱的時刻。上世紀80年代,并行計算機的互聯(lián)結(jié)構(gòu)(Interconnection)的文章很多,蝶形互聯(lián)(butterfly)、超立方體互聯(lián)(Cube)等層出不窮。我在美國讀博士時, H.J. Siegel教授講了一個學(xué)期計算機體系結(jié)構(gòu)課,講的內(nèi)容全是互聯(lián)結(jié)構(gòu)。但是,今天超級計算機用的互聯(lián)結(jié)構(gòu),不是胖樹結(jié)構(gòu),就是多維環(huán)(Torus),都是簡單的互聯(lián)網(wǎng)絡(luò),我不知當(dāng)年發(fā)表那么多互聯(lián)網(wǎng)絡(luò)的文章到底對并行計算機的發(fā)展起了多大作用。有一段時間 ISCA 會議上大多是關(guān)于Cache效率分析的性能模擬方面的文章,計算界的權(quán)威們也不得不站出來說,會議論文許多是垃圾文章。與此相反,陳云霽和陳天石開始用人工智能技術(shù)優(yōu)化芯片設(shè)計的參數(shù)選擇時,既不是國際熱點,文章投稿多次被拒,在國內(nèi)也申請不到經(jīng)費,發(fā)自內(nèi)心的創(chuàng)新驅(qū)動支持他們坐了幾年冷板凳,才有今天的輝煌。為國分憂的宏大敘事是做科研的情懷,選擇具體做什么方向的研究反映一個科研人員的眼光。林彪打仗有“四快一慢”原則,思考作戰(zhàn)方案、決定發(fā)動總攻要慢。我們做科研在選擇具體方向時也要多發(fā)些功夫思考,不要人云亦云隨大流。
體系結(jié)構(gòu)國重這幾年發(fā)展比較順利的一個重要標志是年輕人才成長較快。國重自成立之日,就把“寶”押在年輕人身上,重用了年輕的學(xué)科帶頭人,給他們搭建了足夠?qū)拸V的舞臺。幾年來先后冒出了寒武紀芯片、RISC-V開源芯片、高通量芯片、工業(yè)互聯(lián)網(wǎng)芯片等有前景的新方向,量子計算、超導(dǎo)計算、DNA計算等交叉領(lǐng)域也涌現(xiàn)了一批新人。計算機科學(xué)是一門年輕的學(xué)科,計算機發(fā)展歷史上許多重要的發(fā)明都出自年輕人。目前國內(nèi)的人才評價環(huán)境不理想,人才帽子和“四唯導(dǎo)向”還有一定的負面影響,希望體系結(jié)構(gòu)國重的年青學(xué)者不慕虛名,以科研成果的實際影響力論英雄,不問成功秘訣,只管砥礪前行。計算所和國重的領(lǐng)導(dǎo)者在引進和培養(yǎng)年輕人才上還要多費心思。
計算所和體系結(jié)構(gòu)國重一向重視產(chǎn)業(yè)化,與華為、曙光等企業(yè)開展了卓有成效的合作,國重的成員創(chuàng)辦了一些有活力的新企業(yè),對開源社區(qū)也做了積極貢獻,對工業(yè)界已經(jīng)有較明顯的技術(shù)輻射和影響。國家重點實驗室的價值最終要體現(xiàn)在對產(chǎn)業(yè)界的影響上。我國高技術(shù)企業(yè)對關(guān)鍵技術(shù)和核心技術(shù)的需求越來越強烈,我們不能用老眼光看到今天的企業(yè),一些短平快的簡單技術(shù)可能已經(jīng)不能滿足先進企業(yè)的胃口。相比于國家大力扶植的國家實驗室,國家重點實驗室應(yīng)該更重視下一代核心技術(shù)的研發(fā),為國家實驗室提供強有力的技術(shù)支撐。國重不能關(guān)起門做研究,要多與企業(yè)溝通,把企業(yè)的換代技術(shù)需求轉(zhuǎn)化為我們的課題任務(wù)。
欲窮千里目,更上一層樓。體系結(jié)構(gòu)國重的同仁們,加油!