首頁(yè)>>>技術(shù)>>>cti平臺(tái)

發(fā)表評(píng)論分享按鈕

真正的“人工”智能 讓人意外的“土而奇機(jī)器人”

2011/08/08  


  看到一個(gè)很讓人驚喜的八卦故事。

  一位叫趙行德的人在豆瓣上發(fā)了一個(gè)消息,談到他在和聯(lián)想產(chǎn)品經(jīng)理聊天,了解到了一個(gè)手機(jī)應(yīng)用背后牛逼的故事。這個(gè)故事顯然把他擊倒了。而我,也被擊倒了。

  先說(shuō)說(shuō)故事的引子樂(lè)助理 360,這是一個(gè)很省心的日程應(yīng)用。

  來(lái)舉個(gè)例子吧。這個(gè)應(yīng)用,有三種方式為用戶(hù)設(shè)定手機(jī)日程,語(yǔ)音、文字和直接的電話(huà)。你對(duì)著手機(jī)說(shuō):后天 9 點(diǎn)飛北京,然后上傳,幾分鐘之內(nèi),iPhone 日歷就增加了一條在 9 點(diǎn)“飛北京!”的日程。文字呢?當(dāng)然更好理解,你再也不需要在手機(jī)的日程管理軟件中反復(fù)輸入了,直接在這個(gè)應(yīng)用輸入你的計(jì)劃,和短信一樣發(fā)送,隨后,你的日程也如你所愿就自動(dòng)添加到系統(tǒng)日程了。

  你會(huì)發(fā)現(xiàn)它相當(dāng)方便。智能設(shè)備,特別是全觸屏的手機(jī),輸入一直是很多使用者的心頭痛。語(yǔ)音可以幫助用戶(hù)方便地跨越這類(lèi)門(mén)檻。不過(guò),這類(lèi)應(yīng)用的成本還不僅僅在于單純的輸入,而是在于它需要你進(jìn)行太多的選擇。一個(gè)標(biāo)準(zhǔn)的場(chǎng)景是,拿出 iPhone,用拇指掃開(kāi)屏幕,找到日程應(yīng)用,然后填充一堆的表單區(qū)域。完成一個(gè)簡(jiǎn)單的日程,也需要點(diǎn)擊很多很多次,耗費(fèi)頗長(zhǎng)時(shí)間。喜歡 GTD 的人,也許會(huì)樂(lè)于享受這種編輯歸類(lèi)過(guò)程,但是對(duì)于普通人來(lái)說(shuō),這種體驗(yàn)實(shí)在太差了。

  且慢,還不光是你簡(jiǎn)單動(dòng)動(dòng)嘴皮的問(wèn)題。你會(huì)發(fā)現(xiàn)它非常精確,它很聽(tīng)話(huà),它很懂你,它支持所有的自然語(yǔ)義。這可不簡(jiǎn)單。

  為何語(yǔ)音識(shí)別可不簡(jiǎn)單?它必須要解決各種場(chǎng)合下精確的識(shí)別處理問(wèn)題。一方面,它需要對(duì)所識(shí)別語(yǔ)言規(guī)律和語(yǔ)句的高度理解,另外,它還需要解決各種噪音和干擾情況下(這是語(yǔ)音識(shí)別環(huán)境的常態(tài))的識(shí)別問(wèn)題。語(yǔ)音識(shí)別技術(shù)在商業(yè)和人機(jī)交互上一直以來(lái)缺乏足夠的表現(xiàn),正是由于無(wú)法精確的識(shí)別人類(lèi)語(yǔ)音的表達(dá)。蘋(píng)果去年 4 月耗巨資收購(gòu) Siri,看中的就是它就是可以很準(zhǔn)確地識(shí)別人們的語(yǔ)音,針對(duì)人們提出的問(wèn)題進(jìn)行回答。人們認(rèn)為,這個(gè)在語(yǔ)音識(shí)別領(lǐng)域浸淫已久的 Nuance 開(kāi)發(fā)的語(yǔ)音技術(shù),有可能讓蘋(píng)果開(kāi)啟下一扇人機(jī)交互的大門(mén)。

  但是一個(gè)來(lái)自聯(lián)想的應(yīng)用,解決了這個(gè)問(wèn)題?是聯(lián)想在和科大迅飛搞的語(yǔ)音云合作項(xiàng)目?科大迅飛是聯(lián)想投資的一個(gè)項(xiàng)目,上市前就獲注資數(shù)千萬(wàn)元,而 2010 年底科大迅飛發(fā)布語(yǔ)音云系統(tǒng)時(shí),柳傳志也親自出席了,這不得不讓你有這樣的聯(lián)系聯(lián)想。

  反正我信了。馬上就要和朋友感慨現(xiàn)在科技的日新月異了,CPU 已經(jīng)可以代替人腦,云計(jì)算吧!腦海浮現(xiàn)出機(jī)器人統(tǒng)治世界的場(chǎng)景。

  “人工”智能

  然后,趙行德告訴你“讓人崩潰”的真相:它背后的故事是——它的“高科技”,它的精確,它的“人工智能”,就在于,它真的是人工的!——他們?cè)谶h(yuǎn)端用人聽(tīng)這些語(yǔ)音消息,然后輸入進(jìn)去 ……

  我不知道這個(gè)消息是否屬實(shí),但是我在測(cè)試中發(fā)現(xiàn),它確實(shí)有很強(qiáng)的“人工”跡象。一是我試用這個(gè)軟件的時(shí)候,使用了粵語(yǔ),然后這個(gè)應(yīng)用就在遠(yuǎn)端“死機(jī)”了——日程記錄并沒(méi)有自動(dòng)推送過(guò)來(lái),聽(tīng)聞?wù)f四川話(huà)是 ok 的。二是上傳了語(yǔ)音后,推送日程的處理時(shí)間差別蠻大,感覺(jué)不太象是計(jì)算機(jī)即時(shí)處理的。三是精確度確實(shí)很高,在不同噪音環(huán)境下和不同腔調(diào)下,效果都相當(dāng)不錯(cuò),很難讓你相信這是機(jī)器識(shí)別的。

  不過(guò),這只算一個(gè)八卦消息,真實(shí)的情況仍然待驗(yàn)證,特別是語(yǔ)音識(shí)別系統(tǒng)和呼叫中心的結(jié)合也有商用的案例。簡(jiǎn)單粗暴的直接判斷它是完全人工的不太合適。但是真正有趣的,卻是這個(gè)八卦故事所折射出的“創(chuàng)新”智慧。

  初看,這個(gè)故事包括后續(xù)的回復(fù)都讓人忍俊不禁,但是,回頭一想,也許這真是一個(gè)非常棒的創(chuàng)新,一個(gè)非常聰明的商業(yè)模式的創(chuàng)新。

  為何商業(yè)創(chuàng)新需要高科技呢?商業(yè)創(chuàng)新的意義在于更小的成本創(chuàng)造更大的價(jià)值。據(jù)說(shuō)這個(gè)服務(wù)主意還是聯(lián)想呼叫中心的人想出來(lái)的。它利用到了現(xiàn)有的成熟模式,并在這個(gè)成熟的商業(yè)模式上派生出了另外一種創(chuàng)新價(jià)值。

  這個(gè)服務(wù)的“極其牛逼”之處,在于它把一個(gè)復(fù)雜的問(wèn)題徹底的簡(jiǎn)單化了——而簡(jiǎn)單化,確實(shí)牛逼的商業(yè)模式最為寶貴的特質(zhì)。你不會(huì)看到真正可行的商業(yè)模式是復(fù)雜的,讓人看不懂的。

  它用非常簡(jiǎn)單的方法(人工聽(tīng)),解決了語(yǔ)音識(shí)別精確度問(wèn)題,解決了輸入問(wèn)題(遠(yuǎn)端人工編輯推送),解決了隨時(shí)隨地服務(wù)的問(wèn)題(24小時(shí)的呼叫中心)——至少,讓語(yǔ)音識(shí)別達(dá)到了非常好用的程度。它用超低廉的成本,完成了“高科技”很難做到的效果。它還是可擴(kuò)展的。scalable 這個(gè)詞在互聯(lián)網(wǎng)模式中很熱呢。

  而高科技的云計(jì)算,本質(zhì)和人腦簡(jiǎn)單集合處理并無(wú)不同,也許只是成本問(wèn)題?萍急緛(lái)是要降低成本的,如果在一個(gè)可以用人工比科技更好的降低成本的場(chǎng)合,為何不使用人工呢?

  

  “土而奇機(jī)器人”

  這種智能眾包這也并非是聯(lián)想呼叫中心的獨(dú)創(chuàng)。

  亞馬遜就 2005 年推出一個(gè)叫土耳其機(jī)器人(Mechanical Turk)的服務(wù),其理念,就是讓人力眾包來(lái)完成電腦力有不逮的細(xì)碎、精確的智能工作。這種眾包讓計(jì)算機(jī)調(diào)用人的智慧智能,把人和電腦的角色顛倒過(guò)來(lái),讓人成為任務(wù)的完成者,而電腦成為任務(wù)的分配者。起名叫土耳其機(jī)器人本身也映射了這個(gè)項(xiàng)目的性質(zhì):

  這個(gè)名字源自于臭名遠(yuǎn)揚(yáng)的能下象棋的“自動(dòng)裝置”,它是匈牙利男爵沃爾夫?qū)ゑT·肯佩倫(Wolfgang Von Kempelen)1770年建造的。這個(gè)木制機(jī)器外形像一個(gè)坐在大機(jī)箱前的土耳其魔法師,它能自動(dòng)而快速地下象棋,用復(fù)雜的齒輪和杠桿系統(tǒng)來(lái)移動(dòng)棋子。在維也納皇宮的首次表演中,它就迅速擊敗了對(duì)手Cobenzl伯爵,讓在場(chǎng)的皇室成員看得十分高興。從此關(guān)于這個(gè)驚人聰明的機(jī)器人迅速聞名于世,于是肯佩倫帶著它在歐洲各地表演,擊敗了一系列著名的挑戰(zhàn)者,包括拿破侖和本杰明·富蘭克林。直到幾年之后,這個(gè)騙局才被揭穿。原來(lái)機(jī)箱里藏了一名象棋大師,他用一個(gè)磁鐵系統(tǒng)來(lái)跟蹤對(duì)手的舉動(dòng)并移動(dòng)自己的棋子,這個(gè)人實(shí)際是在模擬一種人工智能。(摘錄自 比特云 )

  這也是我們笑稱(chēng)它為“土”而“奇”機(jī)器人的來(lái)歷。

  可行性?

  理論上的問(wèn)題解決了,我們?cè)賮?lái)看看現(xiàn)實(shí)的商業(yè)問(wèn)題。這得多大的人工成本?!別著急,看看趙行德的初步概算:

  我測(cè)算了一下,平均每個(gè)活躍用戶(hù)每天提交0.5條語(yǔ)音,每個(gè)人每分鐘處理3條語(yǔ)音,每天工作7小時(shí),可以服務(wù)2500個(gè)活躍用戶(hù),100人的數(shù)據(jù)中心可以服務(wù)25萬(wàn)活躍用戶(hù)。

  如果把數(shù)據(jù)中心建在西部貧困地區(qū),月薪800元估計(jì)就足夠了,25萬(wàn)工資成本才8-10萬(wàn),100人的數(shù)據(jù)中心,每人2500元的電腦,投資25萬(wàn),數(shù)據(jù)中心投資30萬(wàn)元,辦公家具設(shè)備5萬(wàn)元,偏遠(yuǎn)貧困地區(qū)租個(gè)辦公室,月租不到5000元,100人工資8萬(wàn)元,寬帶月租2萬(wàn)元,10個(gè)產(chǎn)品開(kāi)發(fā)人員,每月5萬(wàn)元,5個(gè)打雜行政人員,1萬(wàn)元。

  總投資60萬(wàn)元,每月運(yùn)營(yíng)成本16.5萬(wàn),就能辦出給至少25萬(wàn)活躍用戶(hù),100萬(wàn)注冊(cè)用戶(hù)服務(wù)。

  可行嗎?

  對(duì)的,它很土,很奇異,但是,它靠譜(it work),它可行。這個(gè)“土而奇”機(jī)器人很棒。

  這不正是商業(yè)創(chuàng)新的意義嗎?

  目前,這個(gè)服務(wù)是免費(fèi)的。而且所定義的日程服務(wù)類(lèi)型所限,用戶(hù)群也許并不算很大,每天下載量據(jù)說(shuō)是 2000。但是它顯然是一個(gè)可行的商業(yè)模式,同樣的思路,你也許可以把它擴(kuò)展到其他的移動(dòng)互聯(lián)網(wǎng)服務(wù)領(lǐng)域,有拾音功能的移動(dòng)設(shè)備天然就是一個(gè)命令錄入裝置,天然就是一個(gè)可以收集多樣服務(wù)需求進(jìn)行集中處理的終端,智能手機(jī)已經(jīng)為很多“云計(jì)算”的概念提供了堅(jiān)實(shí)的應(yīng)用基礎(chǔ)。

  你會(huì)為這樣的管家類(lèi)服務(wù)掏錢(qián)嗎?至少,我會(huì)的。我覺(jué)得,與其把時(shí)間浪費(fèi)在各種糾結(jié)上,還不如出錢(qián)讓自己在零碎的時(shí)間發(fā)發(fā)呆。

  這正是服務(wù)的意義呢。

愛(ài)范兒



相關(guān)閱讀:
面對(duì)移動(dòng)設(shè)備激增 運(yùn)營(yíng)商優(yōu)化客戶(hù)體驗(yàn)的三個(gè)步驟 2011-08-04
采取行動(dòng),增進(jìn)智能化客戶(hù)交流 2011-08-04
IPCC二次開(kāi)發(fā)資料下載:VXML業(yè)務(wù)功能開(kāi)發(fā)詳解 2011-07-20
連接車(chē)、人和社會(huì):NEC網(wǎng)絡(luò)車(chē)載智能通信構(gòu)想 2011-07-18
LTE為云視頻服務(wù)運(yùn)營(yíng)商/SP創(chuàng)造機(jī)會(huì) 2011-07-08

熱點(diǎn)專(zhuān)題:  語(yǔ)音合成TTS 語(yǔ)音識(shí)別ASR  
分類(lèi)信息:  CTI文摘_與_CTI平臺(tái)技術(shù)