在硅晶圓技術(shù)逐漸接近極限的今天,人們開始關(guān)注下一代計算機(jī)芯片將會采用什么材料來制作?相比量子計算機(jī)、光計算機(jī)、DNA計算機(jī)等更加超前的概念,超導(dǎo)計算機(jī)的可行性要大得多。日前,上海超導(dǎo)科技股份有限公司(以下簡稱上海超導(dǎo))開始利用浪潮TS10000高性能計算集群,開發(fā)新型的超導(dǎo)芯片。
神奇的超導(dǎo)計算機(jī)
目前制成的超導(dǎo)開關(guān)器件,其理論上開關(guān)動作所需時間為千億分之一秒,是當(dāng)今所有電子、半導(dǎo)體、光電器件都無法比擬的。這意味著超導(dǎo)計算機(jī)的運(yùn)算速度將比現(xiàn)在的電子計算機(jī)快100倍,而電能消耗僅是電子計算機(jī)的千分之一。打個比方,如果目前一臺大中型計算機(jī)每小時耗電10千瓦,那么同樣計算力的超導(dǎo)計算機(jī)只需一節(jié)干電池就可以工作了,并且體積也只有原來的幾十分之一。
不過,超導(dǎo)計算機(jī)的實(shí)現(xiàn)還有待于科學(xué)家們對高溫乃至常溫超導(dǎo)材料的研究。目前,科學(xué)家們已經(jīng)發(fā)現(xiàn)有28種元素和幾千種合金和化合物可以成為超導(dǎo)體,但這些超導(dǎo)材料最高的超導(dǎo)臨界溫度也要在零下140度以上??茖W(xué)家們期望尋找到成本低廉的常溫超導(dǎo)材料,利用它制成超導(dǎo)開關(guān)器件和超導(dǎo)存貯器,再利用這些器件制成超導(dǎo)計算機(jī),從而改變整個計算機(jī)的世界。
胖瘦結(jié)合,加速超導(dǎo)芯片研究
超導(dǎo)材料的研究離不開高性能計算機(jī)。不過,超導(dǎo)材料理論較為復(fù)雜,從原理上決定了對高性能計算的要求不盡相同,如Materials Studio、ADF、PWSCF等計算方法對CPU主頻和內(nèi)存帶寬要求比較高,而量化計算Gaussian則對共享內(nèi)存并行效率有更高要求,需要SMP胖節(jié)點(diǎn)服務(wù)器。
根據(jù)上海超導(dǎo)的應(yīng)用需求,浪潮按需定制了基于英特爾?至強(qiáng)?E5-2600V3系列的高性能天梭TS10000集群系統(tǒng),整套系統(tǒng)采用胖瘦節(jié)點(diǎn)分工、高速網(wǎng)絡(luò)和存儲結(jié)合的設(shè)計。其中,瘦計算節(jié)點(diǎn)為滿足高主頻和大內(nèi)存MPI并行計算應(yīng)用需求,使用了浪潮2U雙路機(jī)架服務(wù)器NF5280M4,配置了2.5 GHz主頻、十二核心的E5-2680v3處理器,單節(jié)點(diǎn)128G內(nèi)存,可輕松處理普通計算任務(wù)。而像Gaussian、ATK/VNL、MedeA等應(yīng)用,隨著計算規(guī)模的擴(kuò)大,對內(nèi)存的需求將隨基函數(shù)數(shù)量的平方而增加,特別是支持Open-MP和TPC-Linda兩種并行方式的Gaussian,在選擇MP2計算方法時會產(chǎn)生大量臨時文件常駐內(nèi)存,通用計算節(jié)點(diǎn)將很難完成數(shù)據(jù)處理工作。為此,浪潮提供4U機(jī)架式服務(wù)器NF8460M3作為胖計算節(jié)點(diǎn),配置4顆E7-4820v2處理器,內(nèi)存可擴(kuò)展至2TB,滿足了大內(nèi)存并行計算的需求。
存儲系統(tǒng)采用浪潮TStor500存儲系統(tǒng),提供3GB/s的聚合帶寬,在滿足Gaussian MP2等計算方法對較高IO帶寬要求的同時,也讓整個系統(tǒng)數(shù)以千計的客戶端、服務(wù)器和存儲設(shè)備之間實(shí)現(xiàn)了完全并行。同時,元數(shù)據(jù)服務(wù)器和對象數(shù)據(jù)存儲服務(wù)器在不同的服務(wù)器,兩個對象存儲服務(wù)器采用Actice-Active方式運(yùn)行:元數(shù)據(jù)存儲陣列采用浪潮光纖存儲AS500H,兩個MDS元數(shù)據(jù)節(jié)點(diǎn)保障HA高可用;數(shù)據(jù)存儲節(jié)點(diǎn)采用浪潮4U機(jī)架式服務(wù)器SA5224H,全部采用高性能專用處理器,集成BMC智能控制芯片。為了與高速存儲相匹配,整個集群采用56Gb/s FDR端到端的IB交換機(jī),在1U空間提供36端口互聯(lián)所有計算節(jié)點(diǎn)、管理節(jié)點(diǎn)、登錄節(jié)點(diǎn)和存儲系統(tǒng),實(shí)現(xiàn)了超高的MPI信息傳輸率及微妙級的點(diǎn)對點(diǎn)延遲,提供更好的應(yīng)用程序計算性能。
元數(shù)據(jù)服務(wù)器、對象存儲服務(wù)器和客戶端可以分別運(yùn)行于獨(dú)立的操作系統(tǒng)中,也可以運(yùn)行于一個操作系統(tǒng)內(nèi)部。最優(yōu)的解決方案是元數(shù)據(jù)服務(wù)器位于一個單獨(dú)的服務(wù)器中,對一個元數(shù)據(jù)存儲對象提供服務(wù),單獨(dú)的對象存儲服務(wù)器為多個對象存儲對象提供服務(wù),客戶端也位于單獨(dú)的服務(wù)器。其結(jié)構(gòu)如下圖所示,圖中為一個元數(shù)據(jù)服務(wù)器,一個對象存儲服務(wù)器,和一個客戶端的示意圖,元數(shù)據(jù)服務(wù)器服務(wù)于一個元數(shù)據(jù)存儲對象,對象存儲服務(wù)器服務(wù)于三個目標(biāo)存儲對象。
浪潮還為并行存儲系統(tǒng)配備了自主開發(fā)的智能化、專用定制化的存儲管理界面,支持圖形化界面顯示,支持圖形化安裝與部署,可實(shí)現(xiàn)存儲資源的量化和用戶配額制。
此外,浪潮還為用戶配置了Cluster Engine云服務(wù)平臺及集群部署還原軟件,讓用戶管理整套集群系統(tǒng)就像管理一臺計算機(jī)一樣方便。
“胖瘦組合計算模式”化解超導(dǎo)應(yīng)用難題 ,多個超導(dǎo)科學(xué)領(lǐng)域?qū)<以诮?jīng)過實(shí)際測試后,認(rèn)為浪潮為上海超導(dǎo)量身定制的高性能集群提供了充足的總體計算能力,節(jié)點(diǎn)間的數(shù)據(jù)交換和系統(tǒng)的I/O帶寬加速效果明顯,系統(tǒng)可擴(kuò)展性得到充分保障。同時,浪潮針對實(shí)際運(yùn)算需求開發(fā)的不同級別的軟件應(yīng)用,促進(jìn)了系統(tǒng)內(nèi)部服務(wù)器、存儲、應(yīng)用之間最大限度趨近協(xié)同運(yùn)算,顯著提高了超導(dǎo)材料研究應(yīng)用的運(yùn)行效率。