首頁 > 新聞 > 國內 >

人機交互變革,將引領智能硬件創(chuàng)新

2015-03-19 14:26:42   作者:陳述   來源:搜狐IT   評論:0  點擊:


  多點觸控技術是具有開創(chuàng)性、革命性的發(fā)明。iPhone手機憑此技術,在短短幾年時間內,引領手機從按鍵時代進入觸控時代。單就中國手機市場來看,智能手機占比已經超過90%,而智能手機的人機交互方式,基本以觸控為主。

  當智能手機創(chuàng)新面臨乏力時,Google、蘋果等巨頭開始智能硬件創(chuàng)新探索。一方面在于設備形態(tài)上的創(chuàng)新,如推出谷歌眼鏡、蘋果手表等產品,另一方面是在人機交互的方式上變革,如從iPhone 4S開始,蘋果力推Siri智能語音助手,語音控制技術在國內外得到熱捧。

  一、人機交互未來發(fā)展三個發(fā)展趨勢:多元化、智能化、人格化

  人機交互的歷史可以追溯到18世紀中期的珍妮紡紗車,即從第一次工業(yè)革命,人們就開始了系統(tǒng)思考人機交互的問題。20世紀之后,人機交互的問題,從工業(yè)領域進入到生活領域,這與計算機的發(fā)明與普及有很大關系。進入21世紀,隨著傳感器的普及與應用,人機交互出現了本質性變化,正朝著三個方向發(fā)展。

  一是多元化。鍵盤和鼠標控制在與計算機的交互上應用廣泛,觸控主要是在平板電腦和智能手機的操作上,隨著智能終端種類越來越多,人們對交互體驗要求越來越高,交互方式也越來越多元化,人機交互體驗更加自然、直接。當前并存的幾種交互方式是:鍵盤、鼠標控制,觸控,語音控制,體感控制,眨眼及眼球控制,甚至是腦波控制?梢钥闯,只要是能夠向機器傳遞出信息的方式,人們都在進行探索。

  二是智能化。人機交互的第一階段是人適應計算機,計算機的功能是固有的,交互的意義就在于通過一定的指令獲得相應的反饋。而到了第二階段,則是計算機逐步適應人。比如傳感器的發(fā)展,使得人的各個器官都可以與機器進行交互;再比如,在下班路上讓家里的空調自動開啟,讓機器人幫我們做家務,讓汽車自動駕駛等服務,正在陸續(xù)實現并在生活中應用。

  三是人格化。接著上面向人提供更多服務來談,為你提供服務的也許沒有一個機器人的實體,但會讓你感覺到是在與人交互。典型的例子如siri、微軟小冰等語音助理軟件,它們沒有實體,而是通過大量的語言、語義的學習,更加了解人的思維、文化等,在你提出問題時,它盡可能的去理解你的意思,提供相應的答案。從交互體驗來講,人們更需要的是,與同伴或者助理之間或親密或輕松的交互氛圍,基于人工智能的交互方式正向這種人格化的方向發(fā)展。

  三個發(fā)展趨勢現在已有雛形,在接下來的一段時期內,將會繼續(xù)深化。能夠順應這三種趨勢進行人機交互變革的企業(yè),將會在未來發(fā)展中掌握主動權。

  二、一段時期內,語音控制將是人機交互的核心,引領智能硬件創(chuàng)新

  包括手機在內的智能硬件面臨創(chuàng)新困境,人機交互方式變革是一個較好的切入點。從對操作個性化、方便快捷的智能化角度看,無論是鍵盤還是觸控都遠遠不能與語音相比,語音才是人類溝通和獲取信息最自然的便捷手段和方式。在未來一段時期內,語音控制方式將是人機交互的核心。輸入法中加入語音輸入基本已經成為標配,基于IM軟件的智能機器人越來越活躍,語音助理軟件、語音搜索也被蘋果、Google等企業(yè)應用。

  致力于語音控制研究與實踐的企業(yè)及機構較多。2014年9月業(yè)內成立的“智慧語音聯(lián)盟”,將整合產業(yè)鏈上下游的語音技術和資源優(yōu)勢,共同完善終端語音生態(tài)系統(tǒng)。這里面有我們耳熟能詳的企業(yè),包括中興、Nuance、Audience、高德、百度、中國科學院自動化所等。Nuance曾是蘋果語音助手siri的技術提供商;Audience是音訊芯片解決方案廠商,相關產品在三星、LG、小米等手機有所應用。需要特別強調的是中興和百度。

  中興看準的是用戶對語音控制需求的快速膨脹,遂將智慧語音定位為戰(zhàn)略級技術,在人機交互上解放雙手。應用智慧語音的星星系列產品,與蘋果siri不同,是系統(tǒng)級的語音手機,能夠用于多種場景,包括撥打電話、駕車、出國旅行、辦公記錄等。試想,當你行駛在高速路上需要導航時,只需說出目的地手機就能迅速做出反應并給出路線圖,是不是更安全、更方便呢。事實上,中興發(fā)布的星星2號手機已經可以實現這一功能,帶來了優(yōu)秀的全語音操控的駕駛模式體驗。當然,此類的應用還有很多,比如出國游,對于多數國內游客而言語言不通是最大的障礙,而現在用戶只需要對著星星2號說出想要表達的句子或單詞,手機能快速準確的實現翻譯,仿佛有“同聲翻譯”陪伴左右。

  中興通訊終端CEO曾學忠表示:在星星2號上,中興已經實現了系統(tǒng)級別的語音控制,基本實現了對話式的操控體驗。在語音操控方面,我們要做的是突破人機之間語言的障礙,通過一步步研究的深入,對交互技術的深入,從產品設計、功能設定、場景應用等方面,深入到心理、語義、語調、行為乃至情感層面。聲控只是最終的表現,中興要挖掘潛藏在背后的人機交互的深層。而在產品布局方面,未來3-5年,中興將建立起語音操控的平臺,以智能手機為中心,將語音操控的人機互動模式輻射到穿戴、智能家居、汽車等不同領域,推動物聯(lián)網、車聯(lián)網的發(fā)展和完善。最終,在以語音操控為核心的人機交互領域,中興將成為行業(yè)領導者、規(guī)則的制定者。

  而百度語音是基于深度學習,以百度大腦為基礎的。百度大腦是百度在人工智能時代的核心智能平臺。在語音識別、語義理解上,百度具有較大的優(yōu)勢。百度公司CEO李彥宏在今年兩會提案中,還提出建立“中國大腦”計劃,讓大家在語音識別、視覺識別和自然語言理解上進行技術創(chuàng)新。百度同時也在打造開放的語音平臺,深度融合百科知識、地圖路線、問答結果、天氣等中間頁服務,向不同行業(yè)提供不同的模板。

  曾有人說,打電話撥號就好,為什么要對著電話說“打電話給XX”呢?并認為語音控制只是噱頭,其實這是沒有找對應用場景,在大量的生活領域甚至是工作領域,都有需要解放雙手的場景。比如,你正在洗菜為家人準備晚飯,忽然想電話問問女兒何時到家,但雙手沾滿了水騰不出來,這時候星星2號就體現出優(yōu)勢了,“打電話給女兒”兩個字就能讓你順利撥打電話而不用停下手中的活,諸如此類場景還有很多?梢韵胂笤谖磥淼闹悄苌钪校悄芷囆枰訌氐椎倪x擇語音控制,觸控、手勢和眼睛都不理想;智能電視會給觸控留下生存的機會嗎?如果是的話,僅停留在部分遙控器上;智能手表、眼睛等可穿戴設備,太小的屏幕和特殊的位置,語音控制的優(yōu)勢更加明顯。

  當前,語音控制確實存在一定的問題,如語音識別的準確性和交互的人性化等,但不要低估它五到十年的未來。隨著語音控制交互方式更加智能化、人格化的發(fā)展,其潛力將會被不斷激發(fā)出來。

分享到: 收藏

專題