您當(dāng)前的位置是:  首頁(yè) > 新聞 > 文章精選 >
 首頁(yè) > 新聞 > 文章精選 >

語(yǔ)音識(shí)別技術(shù)會(huì)引領(lǐng)硅谷的下一次革命嗎?

2018-11-20 10:00:30   作者:   來(lái)源:財(cái)富中文網(wǎng)   評(píng)論:0  點(diǎn)擊:


語(yǔ)音識(shí)別技術(shù)會(huì)引領(lǐng)硅谷的下一次革命嗎?
  短短四年前,亞馬遜還只是一家很成功的在線零售商,也是美國(guó)商用在線主機(jī)服務(wù)的主要供應(yīng)商。此外它有也自己的消費(fèi)電子產(chǎn)品,即人們熟知的Kindle電子書。Kindle雖然是一款大膽的作品,但考慮到亞馬遜本身就是賣書起家,這一嘗試自然是可以理解的。現(xiàn)在,亞馬遜的Echo智能音箱和它的Alexa語(yǔ)音識(shí)別引擎又走進(jìn)了很多家庭,可以說(shuō)亞馬遜在個(gè)人計(jì)算與通訊領(lǐng)域,已經(jīng)掀起了自史蒂夫·喬布斯發(fā)布iPhone以來(lái)的最重要的技術(shù)革命。
  一開(kāi)始,它只不過(guò)是個(gè)看似新奇的小玩意兒。2014年11月,亞馬遜發(fā)布了Echo智能音箱,它使用了人工智能技術(shù)來(lái)傾聽(tīng)人類的提問(wèn)。Echo會(huì)掃描聯(lián)網(wǎng)數(shù)據(jù)庫(kù)中的數(shù)百萬(wàn)個(gè)單詞,不論你提出的問(wèn)題是深邃還是淺顯,它都能給出答案。目前,Echo智能音箱的銷量已達(dá)到4700多萬(wàn)臺(tái),其用戶來(lái)自從阿爾巴尼亞到贊比亞的80多個(gè)國(guó)家,其服務(wù)器每天要回答用戶的1.3億多個(gè)問(wèn)題。亞馬遜的語(yǔ)音識(shí)別引擎Alexa得名于亞歷山大港的古埃及圖書館,它可以按照用戶的要求播放音樂(lè),提供天氣預(yù)報(bào)信息或體育比賽的得分,甚至可以遠(yuǎn)程調(diào)節(jié)用戶家里的室溫。它還會(huì)講笑話,回答一些瑣碎的問(wèn)題,抖個(gè)機(jī)靈,或者開(kāi)些無(wú)傷大雅的玩笑。(比如你可以讓它放個(gè)屁來(lái)聽(tīng)聽(tīng))。
  亞馬遜并沒(méi)有“發(fā)明”語(yǔ)音識(shí)別技術(shù),實(shí)際上語(yǔ)音識(shí)別技術(shù)已經(jīng)發(fā)明出來(lái)幾十年了。亞馬遜甚至并不是第一家提供主流語(yǔ)音識(shí)別應(yīng)用的科技巨頭。蘋果的Siri和谷歌語(yǔ)音助手的上市時(shí)間要比它早得多。微軟Cortana的發(fā)布基本上與Alexa在同一時(shí)期。但是隨著Echo的廣泛成功,語(yǔ)音識(shí)別領(lǐng)域的競(jìng)爭(zhēng)驟然激烈了起來(lái),各大科技廠商紛紛投下重注,試圖將這些“智能”家居設(shè)備變得跟PC甚至和智能手機(jī)一樣重要。正如谷歌的搜索引擎算法徹底改變了人們的信息消費(fèi)模式,進(jìn)而顛覆了整個(gè)廣告行業(yè)一樣,由人工智能技術(shù)驅(qū)動(dòng)的語(yǔ)音識(shí)別技術(shù)也會(huì)推動(dòng)類似的革命。亞馬遜Alexa部門的首席科學(xué)家羅希特·普拉薩德表示:“我們想抹平用戶使用互聯(lián)網(wǎng)時(shí)的不順暢,而最自然的方法就是聲音。Alexa不是那種一下子給你展示很多搜索結(jié)果,然后說(shuō)‘選一個(gè)吧’的那種搜索引擎,而是會(huì)直接告訴你答案。”
  各大科技廠商紛紛將人工智能與語(yǔ)音識(shí)別技術(shù)相結(jié)合,其目的遠(yuǎn)遠(yuǎn)不只是為了推出一款圣誕購(gòu)物季最熱賣的小家電這么簡(jiǎn)單。目前,谷歌、蘋果、Facebook和微軟等公司紛紛砸下重金研發(fā)競(jìng)品。據(jù)投資公司LoupVentures的分析師吉恩·蒙斯特估算,上述幾家科技巨頭每年在語(yǔ)音識(shí)別技術(shù)上的研發(fā)支出合計(jì)超過(guò)了50億美元,約占年度研發(fā)預(yù)算總額的10%。他認(rèn)為,語(yǔ)音識(shí)別技術(shù)的出現(xiàn)是計(jì)算領(lǐng)域的一個(gè)“具有重大意義的變化”。他認(rèn)為,語(yǔ)音指令很快將取代鍵盤和觸屏,成為“我們與互聯(lián)網(wǎng)交互的最常見(jiàn)的方式”。
  隨著各大廠商紛紛投入重注,語(yǔ)音識(shí)別助手領(lǐng)域的競(jìng)爭(zhēng)也變得愈發(fā)激烈。從研究公司Canalys提供的數(shù)據(jù)看,目前亞馬遜在這一領(lǐng)域暫時(shí)領(lǐng)先,它在全球聯(lián)網(wǎng)音箱市場(chǎng)上的份額達(dá)到了42%。谷歌的Home智能家居設(shè)備以34%的份額暫居亞軍,它搭載了谷歌自研的谷歌助手,據(jù)說(shuō)近期的銷量已經(jīng)反超了亞馬遜。蘋果的HomePod價(jià)格最貴,加入戰(zhàn)局也是最晚,雖然市場(chǎng)占有率排名第三,但份額仍遠(yuǎn)遠(yuǎn)不如前面兩家。去年10月,F(xiàn)acebook也推出了自己的Portal系列影音設(shè)備,它們也具備部分語(yǔ)音識(shí)別功能。尤其值得注意的是,它搭載的也是亞馬遜的Alexa語(yǔ)音識(shí)別引擎。
語(yǔ)音識(shí)別技術(shù)會(huì)引領(lǐng)硅谷的下一次革命嗎?
語(yǔ)音識(shí)別技術(shù)會(huì)引領(lǐng)硅谷的下一次革命嗎?
  當(dāng)前,聯(lián)網(wǎng)智能音箱以及類似設(shè)備的市場(chǎng)規(guī)模已然不小,而且還在繼續(xù)增長(zhǎng)。不過(guò)對(duì)于這些科技巨頭來(lái)說(shuō),語(yǔ)音識(shí)別技術(shù)的價(jià)值遠(yuǎn)遠(yuǎn)超過(guò)這些設(shè)備本身。據(jù)市場(chǎng)研究機(jī)構(gòu)全球市場(chǎng)觀察公司(GlobalMarketInsights)的研究,2017年,全球智能音箱市場(chǎng)的銷售額是45億元,預(yù)計(jì)到2024年將增長(zhǎng)至300億美元。不過(guò)這幾家科技巨頭顯然并不在乎賣硬件的這點(diǎn)小錢,比如亞馬遜基本是在將Echo保本甚至虧本銷售。在去年歐美地區(qū)的假日購(gòu)物季期間,亞馬遜推出了迷你版的EchoDot音箱,售價(jià)只有29美元,ABI研究公司認(rèn)為這個(gè)價(jià)格甚至還要低于它的零部件成本。各大廠商之所以肯做賠本生意,就是為了把用戶鎖定在他們的其它產(chǎn)品和服務(wù)上。比如亞馬遜就是要通過(guò)Echo產(chǎn)品提高亞馬遜Prime訂閱服務(wù)的價(jià)值。谷歌則寄希望于語(yǔ)音搜索功能能夠引來(lái)更多的廣告收入。蘋果則希望以語(yǔ)音識(shí)別技術(shù)為工具,將手機(jī)、電腦、電視遙控器甚至是車載軟件整合在一塊,打造一體化的體驗(yàn)。
  由于語(yǔ)音識(shí)別領(lǐng)域已經(jīng)吸引了這么多的投資,而且還在快速創(chuàng)新,因此現(xiàn)在預(yù)測(cè)誰(shuí)是贏家還為時(shí)過(guò)早。但有一點(diǎn)大家已經(jīng)形成了共識(shí),那就是有了人工智能加成的語(yǔ)音識(shí)別技術(shù),必然將向今天的智能手機(jī)一樣,成為我們?cè)L問(wèn)互聯(lián)網(wǎng)的新用戶界面。另外,語(yǔ)音識(shí)別技術(shù)也將降低人們使用科技的門檻,促進(jìn)科技的普及。谷歌公司負(fù)責(zé)谷歌助手與搜索業(yè)務(wù)的產(chǎn)品與設(shè)計(jì)的副總裁尼克·?怂贡硎荆“它讓那些不太識(shí)字的人也能使用這個(gè)系統(tǒng)。另外,人們?cè)陂_(kāi)車的時(shí)候也可以使用它,做飯的時(shí)候也可以用它來(lái)聽(tīng)菜譜。每過(guò)一段時(shí)間,科技就會(huì)發(fā)生一次結(jié)構(gòu)性的轉(zhuǎn)變。我們認(rèn)為,語(yǔ)音識(shí)別就是這樣一種轉(zhuǎn)變。”
  雖然如此,但今天的語(yǔ)音識(shí)別技術(shù)仍然處于比較早期的階段。它的應(yīng)用還比較初級(jí),而且它也有一些比較大的風(fēng)險(xiǎn)因素。比如科技公司會(huì)不會(huì)利用它對(duì)用戶進(jìn)行竊聽(tīng),以及科技公司通過(guò)收集公民的語(yǔ)音數(shù)據(jù)又攫取了多少權(quán)力,人們對(duì)這些問(wèn)題都存在著合理的擔(dān)憂。華盛頓大學(xué)電氣工程學(xué)教授、世界頂級(jí)的語(yǔ)音和語(yǔ)言技術(shù)科學(xué)家瑪麗·奧斯坦多夫表示:“有了人工智能語(yǔ)音識(shí)別技術(shù),我們就好比從螺旋槳飛機(jī)進(jìn)入了噴氣式飛機(jī)時(shí)代。”她指出,現(xiàn)在的語(yǔ)音識(shí)別技術(shù)已經(jīng)能夠很好地回答那些直截了當(dāng)?shù)膯?wèn)題,但在真實(shí)語(yǔ)境的對(duì)話中,表現(xiàn)得仍然令人失望。“在能識(shí)別多少個(gè)單詞、聽(tīng)懂多少個(gè)指令上,人工智能語(yǔ)音識(shí)別技術(shù)表現(xiàn)得非常出色。但我們畢竟還沒(méi)進(jìn)入火箭時(shí)代。”
  幾十年來(lái),科技行業(yè)一直堅(jiān)信,語(yǔ)音識(shí)別技術(shù)必將成為下一個(gè)“殺手級(jí)應(yīng)用”。早在上世紀(jì)50年代,貝爾實(shí)驗(yàn)室就開(kāi)發(fā)了一個(gè)名為奧黛麗(Audrey)的系統(tǒng),它可以識(shí)別從1到9的語(yǔ)音數(shù)字。20世紀(jì)90年代時(shí)已經(jīng)有了一款名叫DragonNaturallySpeaking的PC軟件,它可以實(shí)現(xiàn)簡(jiǎn)單的語(yǔ)音識(shí)別功能,而不需要說(shuō)話者每說(shuō)完一個(gè)單詞就尷尬地停頓一會(huì)兒。但直到蘋果公司2010年在iPhone上發(fā)布了Siri語(yǔ)音助手,消費(fèi)者才意識(shí)到一個(gè)擁有強(qiáng)大計(jì)算能力的語(yǔ)音識(shí)別引擎能做哪些事。大約就在同一時(shí)間段,亞馬遜這樣一家充滿了《星際迷航》式幻想的公司(它的老板杰夫·貝佐斯也是一個(gè)正牌《星際》迷)開(kāi)始暢想,能不能將企業(yè)號(hào)星際飛船上的那種會(huì)說(shuō)話的電腦變成現(xiàn)實(shí)。亞馬遜公司的普拉薩德曾發(fā)表過(guò)上百篇關(guān)于語(yǔ)音識(shí)別人工智能及相關(guān)話題的科學(xué)文章,他表示:“在我們的暢想中,未來(lái)你可以通過(guò)語(yǔ)音與任何服務(wù)交互。”而Alexa就是為此而生的。它是一臺(tái)多才多藝的設(shè)備,可以讓消費(fèi)者更容易地與亞馬遜進(jìn)行交互。
  隨著語(yǔ)音識(shí)別技術(shù)的進(jìn)步——也就是計(jì)算速度越來(lái)越快,價(jià)格越來(lái)越便宜,越來(lái)越普及,因此日益主流化——亞馬遜、谷歌、蘋果等科技廠商也得以更容易地建立一個(gè)無(wú)縫的網(wǎng)絡(luò),利用語(yǔ)音識(shí)別技術(shù),將智能家居設(shè)備與他們旗下的其他系統(tǒng)連接起來(lái)。比如蘋果CarPlay的用戶下班路上可以告訴Siri,別忘了在蘋果電視上下載最新一集的《權(quán)力的游戲》,然后讓HomePod等我一回家就開(kāi)始播放。兩年前,谷歌也發(fā)布了基于語(yǔ)音識(shí)別技術(shù)的智能家居產(chǎn)品Home,它將谷歌的音樂(lè)服務(wù)(YouTube)和最新款的Pixel系列手機(jī)和平板產(chǎn)品結(jié)合在了一起。換言之,每個(gè)科技巨頭都將語(yǔ)音識(shí)別技術(shù)當(dāng)作了連接其多個(gè)數(shù)碼產(chǎn)品的紐帶。
  上述幾個(gè)科技巨頭個(gè)個(gè)都有超強(qiáng)的盈利能力,因此他們都有充足的資金來(lái)搞研究和營(yíng)銷,最終拿出的產(chǎn)品也各不相同。蘋果和谷歌都有自己的移動(dòng)操作系統(tǒng),也就是說(shuō),iPhone和所有的安卓手機(jī)在出廠時(shí)就已預(yù)裝了Siri或谷歌助手。相比之下,亞馬遜就得說(shuō)服用戶將Alexa應(yīng)用下載到他們的iPhone或安卓手機(jī)上了。前華爾街分析師蒙斯特認(rèn)為:“要打開(kāi)Alexa語(yǔ)音識(shí)別應(yīng)用,就要比Siri和谷歌助手多花一步,這對(duì)亞馬遜是一個(gè)明顯的劣勢(shì)。”而相比之下,Siri和谷歌助手只需用戶喊一聲它們的名字就能激活。
  不過(guò),iOS和Android是面向所有第三方開(kāi)發(fā)者的,而Alexa應(yīng)用同時(shí)兼容這兩個(gè)平臺(tái),也就是說(shuō),兩個(gè)平臺(tái)上的開(kāi)發(fā)者都可以寫Alexa的程序。亞馬遜CEO杰夫·貝佐斯今年早些時(shí)候曾在一次財(cái)報(bào)發(fā)布會(huì)上稱:“有來(lái)自150多個(gè)國(guó)家的數(shù)萬(wàn)名開(kāi)發(fā)者”都在構(gòu)建Alexa的應(yīng)用程序,并將它們集成到非亞馬遜的設(shè)備里。而合作伙伴也是各大語(yǔ)音識(shí)別應(yīng)用競(jìng)爭(zhēng)的一個(gè)競(jìng)爭(zhēng)戰(zhàn)場(chǎng),F(xiàn)在,Sonos公司的“電聲棒”、Jabra公司的耳機(jī),以及寶馬、福特、豐田等公司的汽車都已用上了Alexa。谷歌的語(yǔ)音識(shí)別程序則被集成到了索尼、鉑傲的音響、August公司的智能門鎖和飛利浦的LED照明系統(tǒng)上。蘋果的HomPod則與FirstAlert公司的安全防衛(wèi)系統(tǒng)和霍尼韋爾公司的智能恒溫器進(jìn)行了合作。谷歌副總裁尼克斯表示:“這些合作的好處是將語(yǔ)音識(shí)別功能整合到了整個(gè)智能家居生態(tài)系統(tǒng),我不用打開(kāi)手機(jī)也能使用應(yīng)用程序了。我只要說(shuō)一聲:‘讓我看看誰(shuí)在門口’,門前的監(jiān)控視頻就會(huì)自動(dòng)顯示出來(lái)?傊,它通過(guò)統(tǒng)一實(shí)現(xiàn)了簡(jiǎn)化。”
  人工智能一直是反烏托邦文化里的?,特別是在《終結(jié)者》和《黑客帝國(guó)》系列電影里,智能機(jī)器人甚至造了人類的反,將人類逼到了“亡球滅種”的邊緣。不過(guò)慶幸的是,現(xiàn)在的我們離被機(jī)器人奴役還有很遠(yuǎn)。不過(guò)人工智能技術(shù)的進(jìn)步,以及廉價(jià)計(jì)算設(shè)備的普及,已經(jīng)讓很多具有科幻感的構(gòu)思成為了現(xiàn)實(shí)。早期的語(yǔ)音識(shí)別程序雖然也不錯(cuò),但也沒(méi)有超過(guò)編寫它們的程序員的最高水平。但現(xiàn)在這些應(yīng)用卻變得越來(lái)越好了,這是因?yàn)樗鼈兺ㄟ^(guò)互聯(lián)網(wǎng)與數(shù)據(jù)中心連接,而且科技公司花了好幾年時(shí)間,用大量數(shù)據(jù)對(duì)這些算法進(jìn)行“訓(xùn)練”,使其學(xué)會(huì)了識(shí)別不同的語(yǔ)言模式,F(xiàn)在,這些人工智能語(yǔ)音識(shí)別應(yīng)用不僅能識(shí)別單詞、方言和俗語(yǔ),甚至還能根據(jù)上下文分析語(yǔ)義(比如通過(guò)分析呼叫中心的客服代表與客戶的電話錄音,或者分析用戶與數(shù)字助手的互動(dòng))。
語(yǔ)音識(shí)別技術(shù)會(huì)引領(lǐng)硅谷的下一次革命嗎?
語(yǔ)音識(shí)別技術(shù)會(huì)引領(lǐng)硅谷的下一次革命嗎?
  語(yǔ)音識(shí)別系統(tǒng)既依賴于計(jì)算機(jī)科學(xué),也依賴于物理學(xué)。語(yǔ)音會(huì)產(chǎn)生空氣振動(dòng),語(yǔ)音引擎則會(huì)接受模擬聲波,然后將其轉(zhuǎn)換成數(shù)字格式,計(jì)算機(jī)就會(huì)分析這些數(shù)據(jù)的意義,而人工智能則能夠加快這一過(guò)程。人工智能首先要搞清楚它收到的語(yǔ)音是不是指向它的系統(tǒng)的,因此它首先要檢測(cè)客戶選定的“喚醒詞”,比如“Alexa”。然后,系統(tǒng)會(huì)使用機(jī)器學(xué)習(xí)模型,對(duì)所接受的數(shù)據(jù)進(jìn)行猜測(cè)。由于這個(gè)模型已經(jīng)用幾百萬(wàn)個(gè)用戶貢獻(xiàn)的語(yǔ)料庫(kù)訓(xùn)練過(guò),因此猜測(cè)的準(zhǔn)確度是很高的。谷歌助手的工程副總裁約翰·斯考威克解釋道:“語(yǔ)音識(shí)別系統(tǒng)首先會(huì)識(shí)別聲音,然后會(huì)把這句話放到語(yǔ)境中去理解。比如說(shuō),如果我說(shuō)了一句:‘天氣怎么樣?’系統(tǒng)就知道,我所指的是一個(gè)國(guó)家或一個(gè)城市的天氣。我們的數(shù)據(jù)庫(kù)中有500萬(wàn)個(gè)單詞的英文詞匯,如果不結(jié)合語(yǔ)境,從500萬(wàn)個(gè)單詞中識(shí)別出一個(gè)詞是極其困難的。但如果人工智能知道你問(wèn)的是一個(gè)城市的情況,那么這就把范圍縮小到了三萬(wàn)分之一,這樣猜中就簡(jiǎn)單多了。”
  有了強(qiáng)大的計(jì)算能力,系統(tǒng)就有了很多學(xué)習(xí)的機(jī)會(huì)。舉個(gè)真實(shí)的例子,為了讓Alexa打開(kāi)家里的微波爐,語(yǔ)音識(shí)別引擎首先要理解這個(gè)指令。也就是說(shuō),它得能夠聽(tīng)懂各州各省的方言,小孩子的高調(diào)門兒,或者是老外的怪腔怪調(diào)。與此同時(shí),它還要過(guò)濾廣播、音樂(lè)等無(wú)關(guān)的背景音。然后,人們使用微波爐時(shí)的指令也是不一樣的。有人可能會(huì)說(shuō):“把我的飯重新熱一下”;有人則可能說(shuō):“打開(kāi)微波爐”或“用微波爐把飯熱兩分鐘。”Alexa這種語(yǔ)音識(shí)別應(yīng)用會(huì)將用戶的問(wèn)題與數(shù)據(jù)庫(kù)中的類似指令進(jìn)行對(duì)比,從而明白“把我的飯重新熱一下”也是用戶有可能下的指令。
  語(yǔ)音識(shí)別技術(shù)之所以近來(lái)大受歡迎,也是由于它在將人類指令轉(zhuǎn)化為行動(dòng)方面表現(xiàn)得相當(dāng)出色。谷歌公司的斯考威克表示,谷歌的語(yǔ)音識(shí)別引擎已經(jīng)能達(dá)到95%的準(zhǔn)確率,比2013年的80%有了明顯提高,幾乎與人類的理解能力不相上下了。近來(lái)該領(lǐng)域的一個(gè)重大成績(jī)是語(yǔ)音識(shí)別引擎已經(jīng)學(xué)會(huì)了如何過(guò)濾背景噪音。不過(guò)只有當(dāng)用戶的指令或問(wèn)題比較簡(jiǎn)單時(shí),系統(tǒng)才能達(dá)到這樣高的識(shí)別率——比如問(wèn)它:“最新的《諜中諜6》什么時(shí)候上映?”如果你就某件事征求Alexa或谷歌助手的意見(jiàn),或是試圖跟它進(jìn)行一場(chǎng)拉鋸式的談話,系統(tǒng)就要么會(huì)給出一個(gè)預(yù)先編程好的幽默答案,要么直接提出抗議:“我不知道怎么回答。”
  在消費(fèi)者看來(lái),語(yǔ)音識(shí)別設(shè)備不僅實(shí)用,有時(shí)也能給人帶來(lái)快樂(lè)。而在制造它們的科技巨頭看來(lái),語(yǔ)音識(shí)別設(shè)備雖小,但是極為高效的收集數(shù)據(jù)者。大約60%的亞馬遜Echo和谷歌Home的用戶至少將語(yǔ)音助手與一種智能家居設(shè)備相連(比如恒溫器、安全系統(tǒng)等),而這些智能家居設(shè)備可以透露關(guān)于用戶生活的無(wú)數(shù)細(xì)節(jié)。對(duì)于亞馬遜、谷歌和蘋果這些公司,他們收集的數(shù)據(jù)越多,就能更好地服務(wù)消費(fèi)者——不管是通過(guò)附加服務(wù)、訂閱服務(wù),還是代表其他商家打廣告。
  這個(gè)領(lǐng)域的商機(jī)也是顯而易見(jiàn)的。一位消費(fèi)者只要將Echo與恒溫器相連,那么如果他看到了智能照明系統(tǒng)的廣告,就也會(huì)傾向于購(gòu)買。如果你對(duì)隱私特別在意,你或許會(huì)覺(jué)得被“竊聽(tīng)”的感覺(jué)很不舒服。但借助這項(xiàng)技術(shù),科技巨頭們已經(jīng)坐擁了海量個(gè)人數(shù)據(jù),反過(guò)來(lái)這些數(shù)據(jù)也使他們能更有效地向消費(fèi)者進(jìn)行營(yíng)銷。
  這幾家科技巨頭的總體戰(zhàn)略各不相同,對(duì)收集來(lái)的數(shù)據(jù)的使用方式也略有差異。亞馬遜表示,Alexa收集來(lái)的數(shù)據(jù)主要用于該軟件的后續(xù)研發(fā),以使它變得更加智能,對(duì)用戶更加實(shí)用。亞馬遜稱,Alexa進(jìn)化得越好,用戶就會(huì)越能看到亞馬遜的產(chǎn)品和服務(wù)的價(jià)值——包括它的Prime會(huì)員計(jì)劃。盡管亞馬遜也在大力推動(dòng)廣告業(yè)務(wù)(市場(chǎng)研究機(jī)構(gòu)eMarketer認(rèn)為,2018年亞馬遜的數(shù)字廣告業(yè)務(wù)收入將達(dá)到46.1億美元),但亞馬遜的一位發(fā)言人表示,公司目前不會(huì)利用Alexa的數(shù)據(jù)賣廣告。谷歌雖然擁有龐大的廣告業(yè)務(wù),卻也一反常態(tài)地表示,不會(huì)使用語(yǔ)音識(shí)別技術(shù)收集的數(shù)據(jù)賣廣告。蘋果向來(lái)號(hào)稱不愿利用顧客數(shù)據(jù)換取商業(yè)利益,此次自然也不例外,蘋果表示,該公司從語(yǔ)音識(shí)別技術(shù)中獲取的用戶數(shù)據(jù)將僅僅用于改善用戶體驗(yàn)——以及銷售更多昂貴的HomePod設(shè)備。
  雖然亞馬遜是做購(gòu)物起家的,但大多數(shù)用戶并未使用語(yǔ)音識(shí)別設(shè)備幫助他們購(gòu)物。亞馬遜不愿透露有多少Echo的用戶用它購(gòu)物,不過(guò)咨詢機(jī)構(gòu)Codex集團(tuán)最近對(duì)網(wǎng)購(gòu)圖書者的一項(xiàng)調(diào)查顯示,只有8%的用戶通過(guò)Echo買過(guò)書,有13%的用戶通過(guò)它聽(tīng)過(guò)電子書。研究機(jī)構(gòu)Canalys的分析師文森特·蒂爾克表示:“人是習(xí)慣性動(dòng)物,如果你想買一個(gè)咖啡杯,你很難對(duì)智能音箱描述出你喜歡的杯子的樣式。”
  亞馬遜表示,公司并未過(guò)分關(guān)注Echo作為購(gòu)物助手的作用,不過(guò)它仍然希望亞馬遜的智能家居設(shè)備能反哺公司的零售業(yè)務(wù)。亞馬遜的自然語(yǔ)言處理科學(xué)家普拉薩德表示:“人總是根據(jù)以前的購(gòu)物習(xí)慣去購(gòu)物。如果你想買幾節(jié)電池,這種東西,你既不需要親眼去挑,也不需要記住買一種。如果以前你從沒(méi)買過(guò)電池,我們當(dāng)然會(huì)建議你買亞馬遜品牌的。”
  語(yǔ)音助手在購(gòu)物上的作用遠(yuǎn)遠(yuǎn)不止買幾節(jié)電池。目前,很多商家都想跟這些科技巨頭合作,并利用這些平臺(tái)。據(jù)OC&C戰(zhàn)略咨詢公司預(yù)測(cè),到2022年,語(yǔ)音識(shí)別購(gòu)物的銷售額將從現(xiàn)在的20億美元增長(zhǎng)至400億美元,F(xiàn)在,有幾款智能家居設(shè)備的迭代產(chǎn)品已經(jīng)展現(xiàn)了這個(gè)潛力。比如亞馬遜和谷歌都推出了帶屏幕的智能家居設(shè)備,它們看起來(lái)有點(diǎn)像小型電腦和電視機(jī)的跨界產(chǎn)品,因此更適合用來(lái)網(wǎng)購(gòu)。2017年春天,亞馬遜推出了230美元的EchoShow。跟其他Echo設(shè)備一樣,EchoShow也內(nèi)置了Alexa應(yīng)用,但用戶也能通過(guò)它看到圖像。這樣一來(lái),消費(fèi)者就可以看見(jiàn)自己想買的商品和購(gòu)物清單了。同時(shí),用戶也可以用它來(lái)看電視、聽(tīng)音樂(lè)、看監(jiān)控視頻、旅行照片等等。而在做這些的時(shí)候,用戶無(wú)需點(diǎn)擊任何一個(gè)按鍵,也完全不需要操縱鼠標(biāo)。
  谷歌已經(jīng)與四家消費(fèi)電子廠商展開(kāi)了合作,有些廠商最近已經(jīng)開(kāi)售安裝了谷歌助手的智能屏產(chǎn)品。比如聯(lián)想的SmartDisplay智能顯示器看起來(lái)很像Facebook的Portal產(chǎn)品,零售價(jià)為250美元,與JBL的LinkView設(shè)備相同。LG也計(jì)劃推出搭載谷歌助手的ThinQView設(shè)備。今年10月,谷歌也開(kāi)始銷售自己HomeHub設(shè)備了,該設(shè)備搭載了一塊7寸顯示屏,售價(jià)為149美元。
  從長(zhǎng)遠(yuǎn)來(lái)看,谷歌認(rèn)為,擁有屏幕將使語(yǔ)音購(gòu)物變得更容易。谷歌并不像亞馬遜那樣直接銷售產(chǎn)品,但它的“谷歌購(gòu)物”網(wǎng)站卻將零售商與谷歌搜索引擎直接相連。目前,谷歌已經(jīng)將Home設(shè)備打造成一個(gè)購(gòu)物工具了。比如谷歌與星巴克有合作,用戶只需要告訴谷歌助手點(diǎn)一杯“老樣子”,飲品就會(huì)自動(dòng)送上門。去年,谷歌還鞏固了與全球最大零售商沃爾瑪?shù)暮献麝P(guān)系。用戶可將沃爾瑪賬戶與谷歌購(gòu)物網(wǎng)站相連,這樣通過(guò)谷歌的Home設(shè)備,用戶即可檢查附近的沃爾瑪門店里有沒(méi)有自己喜歡的運(yùn)動(dòng)鞋,或是預(yù)訂一臺(tái)平板電視當(dāng)日提取。如果你不知道離你最近的沃爾瑪在哪兒,它也能幫你找到。
  而視覺(jué)識(shí)別技術(shù)(它可以看作是人工智能語(yǔ)音識(shí)別技術(shù)的小弟,這種技術(shù)早就被用來(lái)在人群中對(duì)比罪犯了)的興起,將使人們?cè)谶@些設(shè)備上購(gòu)物變得更加便利。今年9月,亞馬遜宣布,它正在用Snapchat相機(jī)測(cè)試一款新應(yīng)用。消費(fèi)只要用Snapchat的相機(jī)拍下某個(gè)產(chǎn)品或者條形碼的照片,就能在屏幕上看到亞馬遜的產(chǎn)品頁(yè)面。不難想象,要不了多久,用戶就能在他們EchoShow上實(shí)現(xiàn)類似功能,到時(shí)候用戶不光能看見(jiàn)產(chǎn)品的價(jià)格和評(píng)價(jià),估計(jì)還能看見(jiàn)該產(chǎn)品是否支持Prime的兩天免費(fèi)快遞上門服務(wù)。
  雖然這項(xiàng)技術(shù)的前景令人興奮,可是對(duì)那些對(duì)高科技不敏感的人來(lái)說(shuō),他們可能得花一些時(shí)間,才能習(xí)慣跟機(jī)器對(duì)話,F(xiàn)在很多科技公司的社會(huì)公信力不高,他們必須得讓消費(fèi)者相信,這些設(shè)備并不是在出于邪惡的原因在竊聽(tīng)他們。實(shí)際上,智能揚(yáng)聲器只有檢測(cè)到“喚醒詞”才會(huì)切換到對(duì)話模式,比如“Alexa”或者“HeyGoogle”。今年5月,亞馬遜不小心將一位波特蘭市的高管與他妻子關(guān)于地板的一段對(duì)話發(fā)送給了他的一名員工。亞馬遜對(duì)此次事故公開(kāi)道歉,并表示它“曲解”了這段對(duì)話。
  口頭指令的出錯(cuò)可能要遠(yuǎn)遠(yuǎn)超過(guò)打字輸入的命令。有些時(shí)候,你甚至可能為此付出代價(jià)。比如去年,達(dá)拉斯的一個(gè)6歲的小女孩在跟Alexa討論餅干和玩偶等話題。幾天后,快遞員就給她家送來(lái)了4磅餅干和一個(gè)價(jià)值170美元的玩偶。亞馬遜表示,Alexa是有家長(zhǎng)控制功有的,如果啟用了該功能,這次事故本不會(huì)發(fā)生。
  不管怎樣,人工智能語(yǔ)音識(shí)別的大規(guī)模采用很可能會(huì)是自然而然的事,畢竟它給我們帶來(lái)了更多的便利。目前,全球的人工智能語(yǔ)音識(shí)別設(shè)備已經(jīng)超過(guò)1億臺(tái),語(yǔ)音成為人與機(jī)器的主要交互媒介只不過(guò)是個(gè)時(shí)間問(wèn)題——哪怕有時(shí)這種對(duì)話只是毫無(wú)營(yíng)養(yǎng)的惡搞和尬笑。(財(cái)富中文網(wǎng))
  本文作者布萊恩·杜梅因撰寫的關(guān)于亞馬遜的一本新書即將由斯克里布納出版社出版。
  本文原載于2018年11月1日刊的《財(cái)富》雜志。
  譯者:樸成奎
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題