您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

中國科學(xué)技術(shù)大學(xué)與華為聯(lián)合發(fā)布基于Open MPI的在網(wǎng)計(jì)算聯(lián)創(chuàng)成果

2021-10-26 11:07:24   作者:   來源:CTI論壇   評論:0  點(diǎn)擊:


  【中國,珠海,2021年10月22日】 在廣東珠海舉行的全國高性能計(jì)算學(xué)術(shù)年會(huì)(CCF HPC China 2021)上,中國科學(xué)技術(shù)大學(xué)與華為聯(lián)合發(fā)布了基于Open MPI的在網(wǎng)計(jì)算聯(lián)合創(chuàng)新成果。
  基于Open MPI的在網(wǎng)計(jì)算聯(lián)創(chuàng)成果發(fā)布現(xiàn)場
  Open MPI是當(dāng)前高性能計(jì)算領(lǐng)域廣泛使用的一個(gè)消息傳遞接口(MPI: Message Passing Interface)庫項(xiàng)目,用于高性能計(jì)算集群中服務(wù)器間通信,被廣泛應(yīng)用于天氣預(yù)報(bào)、加密技術(shù)、流體力學(xué)、天體物理學(xué)、粒子動(dòng)力學(xué)(交互作用計(jì)算)、模式匹配(DNA比較、圖像處理)等各領(lǐng)域的計(jì)算任務(wù),在業(yè)界具有廣泛的使用基礎(chǔ)。
  傳統(tǒng)的超算集群,網(wǎng)絡(luò)僅用于計(jì)算節(jié)點(diǎn)之間互聯(lián),整個(gè)計(jì)算過程以計(jì)算節(jié)點(diǎn)為中心。當(dāng)多個(gè)計(jì)算節(jié)點(diǎn)一起參與通信時(shí),會(huì)有通信步驟多,通信效率低等問題。在網(wǎng)計(jì)算技術(shù)是當(dāng)前高性能計(jì)算(HPC)和人工智能等領(lǐng)域的前沿課題之一,將部分計(jì)算卸載到網(wǎng)絡(luò)中,實(shí)現(xiàn)計(jì)算時(shí)延與服務(wù)器數(shù)目無關(guān),可以有效地降低時(shí)延,提高通信效率,從而縮短計(jì)算任務(wù)的完成時(shí)間。
  中國科學(xué)技術(shù)大學(xué)與華為聯(lián)合開展基于Open MPI的在網(wǎng)計(jì)算項(xiàng)目合作,聯(lián)合研究針對高性能計(jì)算場景的應(yīng)用加速技術(shù),中國科學(xué)技術(shù)大學(xué)完成基于Open MPI的方案設(shè)計(jì)和開發(fā),華為在網(wǎng)絡(luò)設(shè)備端完成在網(wǎng)計(jì)算方案的設(shè)計(jì)和研發(fā),聯(lián)合研究成果基于Open MPI良好的應(yīng)用生態(tài),為高性能計(jì)算領(lǐng)域帶來了一個(gè)針對時(shí)延敏感型計(jì)算任務(wù)性能提升的服務(wù)器端與網(wǎng)絡(luò)端協(xié)同的方案,可有效提升計(jì)算業(yè)務(wù)性能。
  本次聯(lián)合研究成果在中國科學(xué)技術(shù)大學(xué)超級(jí)計(jì)算中心的高性能計(jì)算集群中使用,經(jīng)過驗(yàn)證,運(yùn)行OSU MPI Benchmark性能提高了30%。
  中國科學(xué)技術(shù)大學(xué)是以前沿科學(xué)和高新技術(shù)為主的重點(diǎn)大學(xué),華為是全球領(lǐng)先的信息與通信基礎(chǔ)設(shè)施以及智能終端提供商,也是技術(shù)創(chuàng)新頭部企業(yè),雙方的合作將對超算產(chǎn)業(yè)的發(fā)展發(fā)揮重要意義。雙方領(lǐng)導(dǎo)肯定了這一突破性的合作成果,并將成果開源到社區(qū),希望在先進(jìn)的技術(shù)和開放的生態(tài)下,共同為企業(yè)和用戶提供更加豐富的產(chǎn)品,實(shí)現(xiàn)產(chǎn)業(yè)合作共贏。
  華為數(shù)據(jù)中心網(wǎng)絡(luò)解決方案總監(jiān)張磊
  發(fā)表“超融合數(shù)據(jù)中心網(wǎng)絡(luò),新以太釋放新算力”主題演講
  在此次HPC行業(yè)盛會(huì)的華為論壇上,華為數(shù)據(jù)中心網(wǎng)絡(luò)解決方案總監(jiān)張磊表示,當(dāng)前云數(shù)據(jù)中心正在向算力中心邁進(jìn),業(yè)務(wù)驅(qū)動(dòng)網(wǎng)絡(luò)技術(shù)融合。”單位能效算力””算力的確定性供給”成為算力網(wǎng)絡(luò)核心指標(biāo)。華為超融合數(shù)據(jù)中心網(wǎng)絡(luò)CloudFabric 3.0攻克了傳統(tǒng)以太網(wǎng)易丟包難題,通過智能無損、在網(wǎng)計(jì)算等技術(shù)創(chuàng)新,基于全無損以太架構(gòu)可打破傳統(tǒng)通用計(jì)算、存儲(chǔ)和高性能計(jì)算三套網(wǎng)絡(luò)架構(gòu)的限制,最大化實(shí)現(xiàn)數(shù)據(jù)的無障礙流動(dòng),有效提升算力能效比,并實(shí)現(xiàn)整網(wǎng)全生命周期自動(dòng)化和智能運(yùn)維。經(jīng)權(quán)威第三方機(jī)構(gòu)Tolly專業(yè)測評,華為超融合數(shù)據(jù)中心網(wǎng)絡(luò)相比IB網(wǎng)絡(luò),性能最高可提升17%。
  中國科學(xué)技術(shù)大學(xué)計(jì)算機(jī)學(xué)院教授、超級(jí)計(jì)算中心主任李京
  發(fā)表“現(xiàn)代高性能計(jì)算的網(wǎng)絡(luò)需求及開源MPI優(yōu)化成果分享”主題演講
  中國科學(xué)技術(shù)大學(xué)計(jì)算機(jī)學(xué)院教授、超級(jí)計(jì)算中心主任李京認(rèn)為,高性能計(jì)算網(wǎng)絡(luò)目前的痛點(diǎn)是如何兼得低延遲和高帶寬以及如何針對目標(biāo)場景(高性能計(jì)算、存儲(chǔ)網(wǎng)絡(luò)、異構(gòu)計(jì)算/AI網(wǎng)絡(luò))的特點(diǎn)進(jìn)行網(wǎng)絡(luò)優(yōu)化。目前中國科學(xué)技術(shù)大學(xué)以VASP和OpenFOAM的典型算例為研究對象,針對流量特征,優(yōu)化了開源的Open MPI軟件。下一步中國科學(xué)技術(shù)大學(xué)將結(jié)合應(yīng)用流量特征進(jìn)一步對擁塞控制進(jìn)行優(yōu)化以及針對高性能計(jì)算網(wǎng)絡(luò)的建設(shè)進(jìn)一步研究,比如異構(gòu)計(jì)算網(wǎng)絡(luò)及針對多校區(qū)異地高性能組網(wǎng)的實(shí)現(xiàn)等。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點(diǎn)判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)