語音控制能夠讓互聯(lián)網(wǎng)重新洗牌

2015-03-30 14:45:00 作者：來源：leiphone 評論：0 　點(diǎn)擊：

　　杰森·瑪爾斯（Jason Mars）打造了屬于自己的 Siri，然后貢獻(xiàn)了出來。他是密歇根大學(xué)的一名計(jì)算機(jī)科學(xué)教授，與該校數(shù)名研究人員合作，于最近開發(fā)出了一個(gè)可以對語音命令做出即時(shí)反應(yīng)的數(shù)字助手 Sirius，就像 iPhone 上的 Siri 一樣。接著瑪爾斯開源了 Sirius，免費(fèi)向全世界分享其代碼。

　　軟件工程師可以通過 Sirius 探索現(xiàn)代語音識別的復(fù)雜性，甚至在自己的移動應(yīng)用中加入語音識別功能。在瑪爾斯看來，這就是世界的動人之處。

　　但這一項(xiàng)目還有另一目的�，敔査挂惨庾R到，支撐如今互聯(lián)網(wǎng)的龐大計(jì)算中心還沒有準(zhǔn)備好迎接即將到來的語音革命，他希望通過 Sirius 向這些機(jī)構(gòu)展示該如何改變。他說道：“我們想要理解該如何建造未來的數(shù)據(jù)中心。”

　　要知道，像 Siri、 Google Now 和微軟 Cortana 這些數(shù)字助手并不只是運(yùn)行在手機(jī)上。它們運(yùn)行在計(jì)算中心數(shù)以千計(jì)的機(jī)器里，而隨著全球越來越多的人使用這些服務(wù)，普通機(jī)器已經(jīng)無法滿足運(yùn)行它們的要求了。因?yàn)檫@會占據(jù)太多空間，消耗太多能源。我們需要高效得多的硬件來做這件事。

　　通過 Sirius 這一開源項(xiàng)目，馬爾斯及其同事們（包括一位名為 Yunqi Zhang 的密歇根博士生）就能展示像 Siri 這樣的工具如何在數(shù)據(jù)中心里運(yùn)行，并最終識別出最適合運(yùn)行語音服務(wù)的硬件。這樣的硬件也能用在其他重塑互聯(lián)網(wǎng)的人工智能工具上，如人臉識別、無人駕駛汽車。

　　讓谷歌搜索相形見絀

　　在測試 Sirius 時(shí)，瑪爾斯已經(jīng)證明，用傳統(tǒng)硬件運(yùn)行 Sirius 需要的設(shè)備數(shù)量、空間和能源是谷歌搜索等基于文本的搜索引擎的 168 倍�？紤]到語音識別不僅是移動手機(jī)也是可穿戴設(shè)備的未來，這根本不切實(shí)際�，敔査贡硎荆�“我們將遇到瓶頸。”數(shù)據(jù)中心不僅占據(jù)空間，需要海量資金來建設(shè)，還會消耗海量能源。

　　問題是：用什么硬件來取代傳統(tǒng)機(jī)器？

　　這不僅會影響到蘋果、谷歌、微軟以及眾多應(yīng)用開發(fā)商，還會影響到銷售數(shù)據(jù)中心硬件的公司，乃至英特爾和 AMD 等知名芯片制造商。AMD 首席技術(shù)官 Mark Papermaster 表示：“這對于我們的未來意義重大。”

　　這也是瑪爾斯開展 Sirius 項(xiàng)目的原因。蘋果、谷歌和微軟知道這一新興服務(wù)如何運(yùn)行，但世界上其他人不知道，而他們又需要知道。

　　并行宇宙

　　從谷歌的網(wǎng)絡(luò)搜索服務(wù)到 Facebook 的社交網(wǎng)絡(luò)等大部分網(wǎng)絡(luò)服務(wù)都運(yùn)行在英特爾、AMD 的服務(wù)器芯片上（主要是英特爾）。問題是：這些中央處理器并不怎么適合運(yùn)行 Siri 等語音識別服務(wù)，因?yàn)檎Z音識別服務(wù)需要同時(shí)進(jìn)行非常多的小規(guī)模計(jì)算。

　　正如谷歌、微軟、百度等公司所說的，這些計(jì)算在最初用于處理復(fù)雜數(shù)字圖像的圖形處理（GPU）芯片以及用于特定任務(wù)的可編程門陣列（FPGA）芯片上進(jìn)行效果更好。谷歌已經(jīng)在 Google Now 中使用 GPU 來驅(qū)動類似于人腦的“神經(jīng)網(wǎng)絡(luò)”，微軟則在用 FPGA 驅(qū)動必應(yīng)搜索引擎的部分功能。

　　雖然必應(yīng)并不處理語音，但 GPU、FPGA 能提高所有需要快速完成的網(wǎng)絡(luò)服務(wù)的效能，主要是因?yàn)樗鼈儫o需消耗太多能源，也不占據(jù)太多空間。

　　基本上，如果采用 GPU 和 FPGA，人們就能在一臺機(jī)器上安裝更多芯片。盡管單個(gè) GPU 或 FPGA 芯片不像 CPU 一樣強(qiáng)大，但卻將更大的計(jì)算分成小塊計(jì)算任務(wù)，然后分配給這些 GPU 或 FPGA 芯片處理。這在語音識別等應(yīng)用上尤其吸引人，并行計(jì)算就是為它們而生。Papermaster 表示：“許多新興服務(wù)要求非�？斓貙Ａ啃畔⑦M(jìn)行篩選。由于這些任務(wù)的重復(fù)性，可以通過 GPU 或 FPGA 來加速完成。”

　　GPU 現(xiàn)在不僅是語音識別的必然之選，也是其他基于神經(jīng)網(wǎng)絡(luò)的服務(wù)的選擇。這些“深度學(xué)習(xí)”工具涉及人臉識別、精準(zhǔn)廣告等服務(wù)，最終它們還將幫助驅(qū)動無人駕駛汽車和機(jī)器人。負(fù)責(zé)谷歌大部分深度學(xué)習(xí)工作的 Jeff Dean 表示，谷歌現(xiàn)在在混合使用 GPU 和 CPU，以運(yùn)行驅(qū)動著約 50 種谷歌網(wǎng)絡(luò)服務(wù)的神經(jīng)網(wǎng)絡(luò)。

　　不過微軟也證明，F(xiàn)PGA 可以成為另一種選擇。通過開源數(shù)字助手 Sirius，杰森·瑪爾斯要尋找最適合未來互聯(lián)網(wǎng)服務(wù)的現(xiàn)代數(shù)據(jù)中心架構(gòu)。

　　不限于蘋果和谷歌

　　目前答案依然不明朗。但通過 Sirius，瑪爾斯至少證明了 GPU 和 FPGA 是比 CPU 更好的選擇。瑪爾斯表示：“未來的數(shù)據(jù)中心設(shè)計(jì)必然要包括 GPU 或 FPGA。這至少能帶來一個(gè)數(shù)量級的提升。”

　　他表示，人們可以通過編程讓 FPGA 做任何事情，F(xiàn)PGA 的效率要比 GPU 高得多（根據(jù)密歇根大學(xué)的測試，F(xiàn)PGA 的性能是 CPU 的 16 倍，GPU 約為 10 倍）。但它們需要更多的設(shè)計(jì)工作。谷歌、蘋果和微軟等公司必須招聘能給它們編程的工程師。

　　GPU 也需要一些額外工作。在使用 FPGA 時(shí)，工程師必須對軟件進(jìn)行定制，以適應(yīng)這些芯片。但工程師無需對芯片進(jìn)行編碼�；谶@一原因，GPU 要更為可行，尤其是考慮到語音識別工具最終將不再局限于蘋果、谷歌和微軟，還會進(jìn)入不大愿意雇傭芯片工程師的公司中。

　　瑪爾斯說道：“Siri、Cortana 和 Google Now 以及實(shí)時(shí)進(jìn)行數(shù)據(jù)分析和處理視頻的先進(jìn)應(yīng)用就是技術(shù)的發(fā)展方向，也是行業(yè)的發(fā)展方向。”

　　不管這一切會怎么實(shí)現(xiàn)，都將重塑計(jì)算機(jī)芯片領(lǐng)域。英特爾已經(jīng)在探索 FPGA。GPU 制造商英偉達(dá)正將深度學(xué)習(xí)浪潮推向新高峰。數(shù)年前收購了 GPU 制造商 ATI 的 AMD 也在持續(xù)深入這一領(lǐng)域。正如 Papermaster 所說的，AMD 正在與行業(yè)內(nèi)的各個(gè)公司合作，以便打造出能讓程序員更容易為 GPU 編寫軟件的工具。

　　考慮到 Facebook 和微軟等互聯(lián)網(wǎng)公司正在探索在數(shù)據(jù)中心里使用低功耗的 ARM 芯片，芯片市場注定會在接下來數(shù)年中發(fā)生重大變革。杰森·瑪爾斯以及他的 Sirius 項(xiàng)目旨在展示這一未來會是什么樣。但 Sirius 也可能驅(qū)動這一變革。畢竟，如果大家都在運(yùn)行自己的 Siri，他們就需要自己的芯片。

相關(guān)熱詞搜索：語音控制互聯(lián)網(wǎng)

上一篇:Facebook叫陣蘋果HomeKit 推物聯(lián)網(wǎng)云平臺

下一篇:最后一頁

相關(guān)閱讀：