您當前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

AI時代來臨,您的數(shù)據(jù)中心AI算力100%釋放了嗎?

2019-09-16 14:06:49   作者:   來源:CTI論壇   評論:0  點擊:


  企業(yè)智能化轉(zhuǎn)型升級,AI點石成金
  人類社會正在逐步進入數(shù)字經(jīng)濟周期。應對數(shù)字經(jīng)濟浪潮,據(jù)Gartner統(tǒng)計,67%的大型企業(yè)已經(jīng)將數(shù)字化轉(zhuǎn)型作為企業(yè)核心戰(zhàn)略。與農(nóng)業(yè)經(jīng)濟的關注土地和勞動,工業(yè)經(jīng)濟關注資本和技術截然不同,數(shù)字經(jīng)濟的核心生產(chǎn)要素是數(shù)據(jù)和AI。企業(yè)數(shù)字化轉(zhuǎn)型過程中產(chǎn)生大量的數(shù)據(jù),已經(jīng)成為企業(yè)核心資產(chǎn)的一部分,然而數(shù)據(jù)本身不是目的,知識和智慧才是永恒的價值。通過AI從數(shù)據(jù)中挖掘智慧,實現(xiàn)數(shù)據(jù)的價值變現(xiàn),成為當前企業(yè)數(shù)字化轉(zhuǎn)型的主題。+AI,標志著企業(yè)數(shù)字化轉(zhuǎn)型進入了智能化新階段。
  據(jù)華為GIV(Global Industry Vision)最新預測,到2025年大企業(yè)對AI的采用率將達到97%,AI成為企業(yè)重塑商業(yè)模式、提升客戶體驗和開創(chuàng)未來的關鍵推動力。AI被稱為企業(yè)數(shù)據(jù)金礦的煉金術,通過AI點石成金,成為企業(yè)數(shù)字化、智能化轉(zhuǎn)型成敗的關鍵。
  數(shù)據(jù)中心從云邁入AI階段,釋放AI算力是關鍵
  企業(yè)數(shù)字化轉(zhuǎn)型,智能化升級也推動企業(yè)數(shù)據(jù)中心的變革。企業(yè)數(shù)據(jù)中心正在從云階段邁入了AI新階段。相比而言,云數(shù)據(jù)中心更像是個業(yè)務支撐中心,以應用為中心,通過云平臺實現(xiàn)IT資源的快速發(fā)放。而AI數(shù)據(jù)中心在云數(shù)據(jù)中心基礎上真正演進成為商業(yè)價值中心,以數(shù)據(jù)為中心,采用AI對數(shù)據(jù)進行高效處理。如果說衡量一個云數(shù)據(jù)中心的關鍵指標是業(yè)務發(fā)放的效率,那么衡量AI數(shù)據(jù)中心的關鍵指標就是AI運算效率。
  如何提升AI數(shù)據(jù)中心的運算效率?
  充足AI算力是基礎。我們知道,深度學習的神經(jīng)網(wǎng)絡算法突破引爆了新一輪的AI浪潮,而深度學習需要到巨大的算力支撐,比如一次語音識別的AI訓練涉及到20E(1E=1018次方)次的浮點計算,而谷歌機器翻譯算力需求量達到103E,即便用全世界最高性能的超級計算機Summit來計算,也需要較長的時間。保證有充足的算力成為提升AI運算效率的基礎。
  釋放算力是關鍵。以深度學習為特征的AI運算依賴海量的數(shù)據(jù)的輸入,無論是AI訓練樣本算據(jù)還是AI推理使用的原始算據(jù),均源自海量數(shù)據(jù)。裝載算力的GPU或AI服務器只有獲得完整算據(jù)后才能進行AI處理,否則只能空閑等待,這樣數(shù)據(jù)的存取速度將直接影響算力的發(fā)揮。在很多AI運算系統(tǒng)中,算力的空閑等待時間甚至超過50%,造成算力的浪費。如何保證算力100%釋放成為AI運算效率的關鍵。
  AI時代數(shù)據(jù)中心架構重塑,網(wǎng)絡丟包成為瓶頸
  當前的云數(shù)據(jù)中心建設基本思路是采用虛擬化技術對IT資源池化管理,通過SDx技術完成資源的統(tǒng)一按需自助和自動化發(fā)放,最終實現(xiàn)Everything as a Service的云化服務形態(tài)。而為了滿足數(shù)據(jù)中心充分釋放AI算力從而使得AI運算高效運行的訴求,面向AI時代的數(shù)據(jù)中心架構正在重塑。
  以全閃存存儲數(shù)據(jù)湖為核心,以GPU或AI智能計算為算力底座的AI時代數(shù)據(jù)中心架構,越來越得到業(yè)界的廣泛認可。
  在AI時代數(shù)據(jù)中心新架構中,作為數(shù)據(jù)中心核心組成的存儲和計算正在發(fā)生顛覆性的變革:全閃存化存儲介質(zhì)使得存儲時延降低百倍,GPU/AI智能計算使得計算性能提升百倍。從而導致傳統(tǒng)以太網(wǎng)因擁塞易丟包帶來的網(wǎng)絡傳輸瓶頸異常突顯。
  根據(jù)業(yè)界統(tǒng)計,即便在低于10%鏈路帶寬利用率的低負載流量環(huán)境下,突發(fā)流量引起的網(wǎng)絡的丟包率也接近1‰,而這1‰的丟包在AI運算系統(tǒng)中直接帶來算力損失接近50%。然而,隨著業(yè)務負載增加,數(shù)據(jù)中心分布式多打一流量逐步增多,網(wǎng)絡丟包問題愈發(fā)嚴重。
  因此,0丟包的無損網(wǎng)絡,是保證算力100%釋放的關鍵,成為AI時代數(shù)據(jù)中心的必要條件。
  0丟包的智能無損網(wǎng)絡,是AI時代數(shù)據(jù)中心的最佳選擇
  如何構建一個0丟包的數(shù)據(jù)中心網(wǎng)絡呢?為了在云數(shù)據(jù)中心中解決丟包問題,很多AI業(yè)務相關的場景中,十幾年前提出的無損以太DCB(Data Center Bridging)的部分技術甚至也被重新使用。但當年DCB中相關技術由于嚴重依賴靜態(tài)手工配置,網(wǎng)絡無法根據(jù)流量的變化動態(tài)調(diào)整參數(shù)而導致粗暴反壓使得網(wǎng)絡性能很差。并且每次業(yè)務負載的變化,最優(yōu)參數(shù)的調(diào)整往往需要有經(jīng)驗的工程師持續(xù)2天以上的遍歷嘗試。
  頻繁的網(wǎng)絡負載模型變化需要參數(shù)的持續(xù)調(diào)整,否則要么網(wǎng)絡欠吞吐,要么仍然丟包,這基本限制了參數(shù)靜態(tài)手工配置方式在大規(guī)模、多AI業(yè)務的數(shù)據(jù)中心的適用性。
  華為率先將AI芯片引入交換機,通過深度學習的神經(jīng)網(wǎng)絡算法,實現(xiàn)網(wǎng)絡自調(diào)參、自優(yōu)化,從而解決了手工配置靜態(tài)參數(shù)導致網(wǎng)絡無法動態(tài)適應負載流量模型變化的問題,實現(xiàn)真正的0丟包智能無損網(wǎng)絡,甚至網(wǎng)絡吞吐接近100%時仍然不丟包。
  華為認為,0丟包的智能無損網(wǎng)絡必將引領AI時代數(shù)據(jù)中心的發(fā)展趨勢,高效支撐AI運算,是AI時代數(shù)據(jù)中心的最佳選擇。
  HUAWEI CONNECT 2019作為華為自辦的面向ICT產(chǎn)業(yè)的全球性年度旗艦大會,將于2019年9月18日-20日在上海隆重舉行。本屆大會以“共創(chuàng)智能新高度”為主題,旨在搭建一個開放、合作、共享的平臺,與客戶伙伴一起共同探討如何把握新機遇創(chuàng)造智能未來。
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

CTI論壇會員企業(yè)