首頁 > 新聞 > 國際 >

對話百度美國研究中心:打造綠色數(shù)據(jù)中心

2015-02-06 14:32:29   作者:   來源:DoNews   評論:0  點擊:


  2月5日消息 美國硅谷,這個孕育全球互聯(lián)網(wǎng)公司的地方已經(jīng)誕生了包括Oracle、Facebook、LinkedIn、Apple這樣國際巨頭,還包括Yelp、Airbnb這樣的創(chuàng)新產(chǎn)品。

  無論是市值過千億的公司,亦或是誕生數(shù)月的初創(chuàng)公司,創(chuàng)新無疑已經(jīng)成為了唯一的生存之道。

  受百度之邀,DoNews記者探訪了位于硅谷腹地的百度美國研究中心,Microsoft、Google、Amazon近在咫尺。正如百度美研高級技術(shù)總監(jiān)呂厚昌介紹,百度美國研究中心所擔(dān)負(fù)的任務(wù)是解決最富有挑戰(zhàn)的問題。

  那么,什么才是最富有挑戰(zhàn)的問題呢?百度美研資深架構(gòu)師James Peng透露,2014年百度頒發(fā)了6個百萬美金大獎,其中有4個就被美研團(tuán)隊拿到了,這可以解釋百度美研在百度整體架構(gòu)的重要性,也完全有能力去解決最富有挑戰(zhàn)性的問題。

  數(shù)據(jù)與效能的平衡

  百度美研資深架構(gòu)師James Peng介紹稱,大數(shù)據(jù)是目前百度美研最重要的項目之一。通俗的講,大數(shù)據(jù)就是按照一定的規(guī)則將有效的數(shù)據(jù)中海量的數(shù)據(jù)中提取出來并加以處理和研究。

  James Peng表示,目前百度已經(jīng)可以獲得基礎(chǔ)的數(shù)據(jù),但是數(shù)據(jù)量驚人,而處理這些海量數(shù)據(jù)的工作量就變得異常驚人,即便是通過大規(guī)模服務(wù)器集群來計算時間也變得非常長。

  等計算機(jī)將有效的數(shù)據(jù)提取出來也早已失去了時效性,而百度美研正在處理這些棘手的問題,將大數(shù)據(jù)處理的質(zhì)量和速度大幅度提升,從而真正的將大數(shù)據(jù)造福于用戶。

  打造綠色的數(shù)據(jù)中心

  對于百度、Google、Facebook這樣的巨頭互聯(lián)網(wǎng)公司,每天都會接受到全球數(shù)百億、數(shù)千億次的訪問請求,而處理這些不同的服務(wù)請求就需要大規(guī)模的服務(wù)器集群來計算,簡而言之,服務(wù)器數(shù)量越多,反饋給用戶的速度就會越快,那問題也會隨之而來,如何才能將大規(guī)模的服務(wù)器集群的計算效率變得更高?

  百度美研高級技術(shù)總監(jiān)呂厚昌表示,百度美研另一項最重要的工作就是打造全球最綠色的數(shù)據(jù)中心,百度位于山西陽泉的數(shù)據(jù)中心就由百度美研所參與。

  陽泉數(shù)據(jù)中心是世界首個支持深度學(xué)習(xí)的GPU計算環(huán)境,中心擁有300萬內(nèi)核的計算能力以及4000PB的數(shù)據(jù)量。

  最值得一提的就是PUE,陽泉數(shù)據(jù)中心的PUE小于1.3,呂厚昌詳細(xì)解釋了PUE<1.3的意義,1.3度電進(jìn)入到機(jī)房,其中有1度電用戶數(shù)據(jù)計算,0.3用于散熱等基礎(chǔ)設(shè)施,呂厚昌稱,PUE<2在業(yè)內(nèi)都在接受范圍之內(nèi),假設(shè)PUE=2就意味著有50%的電能會被浪費(fèi)掉。

  深度學(xué)習(xí)的全球地位

  Deep Text、Deep Image及Deep Speech是百度美研的三大深度學(xué)習(xí)項目,James Peng介紹道,目前全球的研究成果在Deep Text方面的差距都不大,Deep Image及Deep Speech由于收到客觀因素的影響,各公司的研究成果就會存在差異,而百度在這兩方面已經(jīng)站在了世界前列。

  Deep Speech主要是針對語音識別的研究項目,在無噪音環(huán)境下,包括Apple、Google在內(nèi)的研究項目基本都差不多,噪音環(huán)境下的識別能力才是關(guān)鍵。

  James Peng介紹,目前百度Deep Speech在噪音環(huán)境中的測試成績已經(jīng)能夠超越同類研究項目,將識別錯率降低到了20%以下。

  人工智能的深度學(xué)習(xí)項目目前還處于實驗室研究階段,暫時還沒有進(jìn)入產(chǎn)品階段。

分享到: 收藏

專題