您當(dāng)前的位置是:  首頁(yè) > 資訊 > 國(guó)內(nèi) >
 首頁(yè) > 資訊 > 國(guó)內(nèi) >

為快而生”丨華為聯(lián)手中科大鑄就高校超算新標(biāo)桿

2020-07-28 09:44:51   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  “小科小科,吃飯去啊。”
  “你們先去吧,等會(huì)人少了我再去。最近事太多,我要抓緊把這組數(shù)據(jù)跑個(gè)結(jié)果出來(lái),導(dǎo)師催著要呢。”
  “你還在用咱們實(shí)驗(yàn)室的集群在跑嗎?”
  “是啊,實(shí)驗(yàn)室買了這么多服務(wù)器,可還是跑的很慢。”
  “你去超算中心啊,他那邊跑的快很多。”
  “我之前試過(guò),那邊排隊(duì)太長(zhǎng)了,比我們實(shí)驗(yàn)室快不了多少。”
  “現(xiàn)在他們新買的華為HPC平臺(tái),規(guī)模比之前大了很多,作業(yè)周轉(zhuǎn)快基本不用排隊(duì)。而且I/O特別快,算我們這種作業(yè)快得不要不要的。”
  “真的嗎?那我趕緊試試華為的平臺(tái)。”
  小科登錄超算中心的系統(tǒng),提交了幾個(gè)計(jì)算作業(yè)。不用不知道,一用就見(jiàn)識(shí)了這個(gè)平臺(tái)的快:下午提交的作業(yè)到凌晨依次運(yùn)行完畢,第二天一早就拿到了需要的計(jì)算結(jié)果。
  “幸虧你推薦我去超算中心跑程序,不然用實(shí)驗(yàn)室的集群估計(jì)還要跑10天半個(gè)月。”
  瀚海助力科大超算集群表現(xiàn)亮眼
  幫助小科的這個(gè)平臺(tái)叫做“瀚海20超級(jí)計(jì)算系統(tǒng)”,他擁有CPU計(jì)算集群30480顆核,系統(tǒng)理論峰值性能2.52Pflops,實(shí)測(cè)HPL雙精度浮點(diǎn)計(jì)算能力:700個(gè)節(jié)點(diǎn)1.43PFlops,計(jì)算效率為63.95%,甚至部分計(jì)算節(jié)點(diǎn)HPL效率跑出了71%以上的超高性能。“瀚海20系統(tǒng)”采用InfiniBand HDR100 100Gbps網(wǎng)絡(luò)技術(shù)構(gòu)建的全線速的高速計(jì)算網(wǎng)絡(luò),在600納秒的極低延遲下,每秒可發(fā)送2億條消息,讓用戶獲得更快的網(wǎng)絡(luò)性能,也是全國(guó)高校首例。
  瀚海20系統(tǒng)單節(jié)點(diǎn)HPL性能統(tǒng)計(jì)
  中科大瀚海20系統(tǒng)負(fù)載
  不光是小科同學(xué),中科大合肥微尺度物質(zhì)科學(xué)國(guó)家研究中心的胡老師針對(duì)大尺度分子固體材料的第一性原理計(jì)算模擬,以自主開(kāi)發(fā)的第一性原理線性標(biāo)度計(jì)算軟件DGDFT[JCP 143, 124110 (2015)]為基礎(chǔ),開(kāi)發(fā)低標(biāo)度、低通訊,低內(nèi)存、低訪存的并行計(jì)算方法,實(shí)現(xiàn)超大規(guī)模高性能并行計(jì)算,其中DGDFT采用了多級(jí)MPI并行以及高效求本征值方法,具有高度可擴(kuò)展性。而本次測(cè)試在某校外超算和“瀚海20系統(tǒng)”超算平臺(tái)上分別計(jì)算金屬石墨烯C2880(2880個(gè)碳原子),在相同核數(shù)下的絕對(duì)計(jì)算速度比該校外超算運(yùn)行快30%以上。
  DGDFT軟件在校外某超算和“瀚海20”超算系統(tǒng)上測(cè)試金屬石墨烯C2880計(jì)算的并行
  瀚海為用戶提供多種選擇
  “瀚海20系統(tǒng)”還為科研用戶提供了多種計(jì)算選擇,其采用20臺(tái)華為T(mén)aishan服務(wù)器構(gòu)建的鯤鵬生態(tài)計(jì)算集群,其中的華為T(mén)aishan服務(wù)器采用鯤鵬架構(gòu),該架構(gòu)芯片在部分單精度和整型計(jì)算應(yīng)用程序性能表現(xiàn)優(yōu)異,可用于生物信息學(xué)計(jì)算軟件,和流體力學(xué)計(jì)算。中國(guó)科大網(wǎng)絡(luò)信息中心張煥杰老師就利用其實(shí)現(xiàn)了ARM平臺(tái)甄別郵件系統(tǒng)中用戶弱口令問(wèn)題,由原來(lái)的需要1天,縮短到30幾秒即可完成,大大縮短了處理時(shí)間,提高了郵件系統(tǒng)的安全性。
  瀚海超算集群節(jié)能環(huán)保
  中科大“瀚海20系統(tǒng)”不只性能強(qiáng),而且更加綠色環(huán)保,系統(tǒng)采用液冷技術(shù)進(jìn)行高效散熱,可循環(huán)使用的冷卻水流經(jīng)CPU、內(nèi)存等高發(fā)熱量器件,80%的熱量直接由冷卻水帶走,大幅降低超算中心的散熱能耗。其中的720臺(tái)華為X6000液冷高密服務(wù)器計(jì)算節(jié)點(diǎn)僅需10個(gè)機(jī)柜即可部署,每個(gè)機(jī)柜72個(gè)節(jié)點(diǎn)39KW的超高密計(jì)算系統(tǒng),相比傳統(tǒng)服務(wù)器每年至少可節(jié)省電費(fèi)17余萬(wàn)元。
  中科大“瀚海20系統(tǒng)”

  中科大“瀚海20系統(tǒng)”液冷計(jì)算節(jié)點(diǎn)
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)