語音控制能夠讓互聯(lián)網(wǎng)重新洗牌

2015-03-30 14:45:00   作者:   來源:leiphone   評論:0  點(diǎn)擊:


  杰森·瑪爾斯(Jason Mars)打造了屬于自己的 Siri,然后貢獻(xiàn)了出來。他是密歇根大學(xué)的一名計(jì)算機(jī)科學(xué)教授,與該校數(shù)名研究人員合作,于最近開發(fā)出了一個(gè)可以對語音命令做出即時(shí)反應(yīng)的數(shù)字助手 Sirius,就像 iPhone 上的 Siri 一樣。接著瑪爾斯開源了 Sirius,免費(fèi)向全世界分享其代碼。

  軟件工程師可以通過 Sirius 探索現(xiàn)代語音識別的復(fù)雜性,甚至在自己的移動應(yīng)用中加入語音識別功能。在瑪爾斯看來,這就是世界的動人之處。

  但這一項(xiàng)目還有另一目的,敔査挂惨庾R到,支撐如今互聯(lián)網(wǎng)的龐大計(jì)算中心還沒有準(zhǔn)備好迎接即將到來的語音革命,他希望通過 Sirius 向這些機(jī)構(gòu)展示該如何改變。他說道:“我們想要理解該如何建造未來的數(shù)據(jù)中心。”

  要知道,像 Siri、 Google Now 和微軟 Cortana 這些數(shù)字助手并不只是運(yùn)行在手機(jī)上。它們運(yùn)行在計(jì)算中心數(shù)以千計(jì)的機(jī)器里,而隨著全球越來越多的人使用這些服務(wù),普通機(jī)器已經(jīng)無法滿足運(yùn)行它們的要求了。因?yàn)檫@會占據(jù)太多空間,消耗太多能源。我們需要高效得多的硬件來做這件事。

  通過 Sirius 這一開源項(xiàng)目,馬爾斯及其同事們(包括一位名為 Yunqi Zhang 的密歇根博士生)就能展示像 Siri 這樣的工具如何在數(shù)據(jù)中心里運(yùn)行,并最終識別出最適合運(yùn)行語音服務(wù)的硬件。這樣的硬件也能用在其他重塑互聯(lián)網(wǎng)的人工智能工具上,如人臉識別、無人駕駛汽車。

  讓谷歌搜索相形見絀

  在測試 Sirius 時(shí),瑪爾斯已經(jīng)證明,用傳統(tǒng)硬件運(yùn)行 Sirius 需要的設(shè)備數(shù)量、空間和能源是谷歌搜索等基于文本的搜索引擎的 168 倍?紤]到語音識別不僅是移動手機(jī)也是可穿戴設(shè)備的未來,這根本不切實(shí)際,敔査贡硎荆“我們將遇到瓶頸。”數(shù)據(jù)中心不僅占據(jù)空間,需要海量資金來建設(shè),還會消耗海量能源。

  問題是:用什么硬件來取代傳統(tǒng)機(jī)器?

  這不僅會影響到蘋果、谷歌、微軟以及眾多應(yīng)用開發(fā)商,還會影響到銷售數(shù)據(jù)中心硬件的公司,乃至英特爾和 AMD 等知名芯片制造商。AMD 首席技術(shù)官 Mark Papermaster 表示:“這對于我們的未來意義重大。”

  這也是瑪爾斯開展 Sirius 項(xiàng)目的原因。蘋果、谷歌和微軟知道這一新興服務(wù)如何運(yùn)行,但世界上其他人不知道,而他們又需要知道。

  并行宇宙

  從谷歌的網(wǎng)絡(luò)搜索服務(wù)到 Facebook 的社交網(wǎng)絡(luò)等大部分網(wǎng)絡(luò)服務(wù)都運(yùn)行在英特爾、AMD 的服務(wù)器芯片上(主要是英特爾)。問題是:這些中央處理器并不怎么適合運(yùn)行 Siri 等語音識別服務(wù),因?yàn)檎Z音識別服務(wù)需要同時(shí)進(jìn)行非常多的小規(guī)模計(jì)算。

  正如谷歌、微軟、百度等公司所說的,這些計(jì)算在最初用于處理復(fù)雜數(shù)字圖像的圖形處理(GPU)芯片以及用于特定任務(wù)的可編程門陣列(FPGA)芯片上進(jìn)行效果更好。谷歌已經(jīng)在 Google Now 中使用 GPU 來驅(qū)動類似于人腦的“神經(jīng)網(wǎng)絡(luò)”,微軟則在用 FPGA 驅(qū)動必應(yīng)搜索引擎的部分功能。

  雖然必應(yīng)并不處理語音,但 GPU、FPGA 能提高所有需要快速完成的網(wǎng)絡(luò)服務(wù)的效能,主要是因?yàn)樗鼈儫o需消耗太多能源,也不占據(jù)太多空間。

  基本上,如果采用 GPU 和 FPGA,人們就能在一臺機(jī)器上安裝更多芯片。盡管單個(gè) GPU 或 FPGA 芯片不像 CPU 一樣強(qiáng)大,但卻將更大的計(jì)算分成小塊計(jì)算任務(wù),然后分配給這些 GPU 或 FPGA 芯片處理。這在語音識別等應(yīng)用上尤其吸引人,并行計(jì)算就是為它們而生。Papermaster 表示:“許多新興服務(wù)要求非?斓貙A啃畔⑦M(jìn)行篩選。由于這些任務(wù)的重復(fù)性,可以通過 GPU 或 FPGA 來加速完成。”

  GPU 現(xiàn)在不僅是語音識別的必然之選,也是其他基于神經(jīng)網(wǎng)絡(luò)的服務(wù)的選擇。這些“深度學(xué)習(xí)”工具涉及人臉識別、精準(zhǔn)廣告等服務(wù),最終它們還將幫助驅(qū)動無人駕駛汽車和機(jī)器人。負(fù)責(zé)谷歌大部分深度學(xué)習(xí)工作的 Jeff Dean 表示,谷歌現(xiàn)在在混合使用 GPU 和 CPU,以運(yùn)行驅(qū)動著約 50 種谷歌網(wǎng)絡(luò)服務(wù)的神經(jīng)網(wǎng)絡(luò)。

  不過微軟也證明,F(xiàn)PGA 可以成為另一種選擇。通過開源數(shù)字助手 Sirius,杰森·瑪爾斯要尋找最適合未來互聯(lián)網(wǎng)服務(wù)的現(xiàn)代數(shù)據(jù)中心架構(gòu)。

  不限于蘋果和谷歌

  目前答案依然不明朗。但通過 Sirius,瑪爾斯至少證明了 GPU 和 FPGA 是比 CPU 更好的選擇。瑪爾斯表示:“未來的數(shù)據(jù)中心設(shè)計(jì)必然要包括 GPU 或 FPGA。這至少能帶來一個(gè)數(shù)量級的提升。”

  他表示,人們可以通過編程讓 FPGA 做任何事情,F(xiàn)PGA 的效率要比 GPU 高得多(根據(jù)密歇根大學(xué)的測試,F(xiàn)PGA 的性能是 CPU 的 16 倍,GPU 約為 10 倍)。但它們需要更多的設(shè)計(jì)工作。谷歌、蘋果和微軟等公司必須招聘能給它們編程的工程師。

  GPU 也需要一些額外工作。在使用 FPGA 時(shí),工程師必須對軟件進(jìn)行定制,以適應(yīng)這些芯片。但工程師無需對芯片進(jìn)行編碼;谶@一原因,GPU 要更為可行,尤其是考慮到語音識別工具最終將不再局限于蘋果、谷歌和微軟,還會進(jìn)入不大愿意雇傭芯片工程師的公司中。

  瑪爾斯說道:“Siri、Cortana 和 Google Now 以及實(shí)時(shí)進(jìn)行數(shù)據(jù)分析和處理視頻的先進(jìn)應(yīng)用就是技術(shù)的發(fā)展方向,也是行業(yè)的發(fā)展方向。”

  不管這一切會怎么實(shí)現(xiàn),都將重塑計(jì)算機(jī)芯片領(lǐng)域。英特爾已經(jīng)在探索 FPGA。GPU 制造商英偉達(dá)正將深度學(xué)習(xí)浪潮推向新高峰。數(shù)年前收購了 GPU 制造商 ATI 的 AMD 也在持續(xù)深入這一領(lǐng)域。正如 Papermaster 所說的,AMD 正在與行業(yè)內(nèi)的各個(gè)公司合作,以便打造出能讓程序員更容易為 GPU 編寫軟件的工具。

  考慮到 Facebook 和微軟等互聯(lián)網(wǎng)公司正在探索在數(shù)據(jù)中心里使用低功耗的 ARM 芯片,芯片市場注定會在接下來數(shù)年中發(fā)生重大變革。杰森·瑪爾斯以及他的 Sirius 項(xiàng)目旨在展示這一未來會是什么樣。但 Sirius 也可能驅(qū)動這一變革。畢竟,如果大家都在運(yùn)行自己的 Siri,他們就需要自己的芯片。

分享到: 收藏

專題