您當(dāng)前的位置是:  首頁(yè) > 新聞 > 國(guó)內(nèi) >
 首頁(yè) > 新聞 > 國(guó)內(nèi) >

同傳、速記、話務(wù)員將下崗 專家談智能語(yǔ)音的下一個(gè)時(shí)代

2016-11-08 10:30:03   作者:   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  最近,畢馬威會(huì)計(jì)事務(wù)所在一份報(bào)告中預(yù)測(cè):到2030年,銀行的許多服務(wù)性工作崗位將消失,取而代之的是類似蘋果公司Siri的智能語(yǔ)音系統(tǒng)。不管這一預(yù)測(cè)是否準(zhǔn)確,智能語(yǔ)音技術(shù)進(jìn)入我們的生活,已是事實(shí)。它在哪些領(lǐng)域能夠取代人的工作?其應(yīng)用前景如何?在發(fā)展過程中,還存在什么技術(shù)瓶頸?記者采訪了上海交通大學(xué)和科大訊飛的專家。
同聲傳譯將由機(jī)器來做
同聲傳譯將由機(jī)器來做
  在近日舉行的錘子手機(jī)發(fā)布會(huì)上,訊飛輸入法有一段驚艷表現(xiàn):在羅永浩講完一大段不太標(biāo)準(zhǔn)的普通話后,這款軟件幾乎一字不差地記錄下來,標(biāo)點(diǎn)符號(hào)也基本正確。談及準(zhǔn)確率高的原因,科大訊飛上海分公司總經(jīng)理程蘇表示,訊飛輸入法具有語(yǔ)音識(shí)別和語(yǔ)義識(shí)別功能,不但能把普通話、方言、外語(yǔ)的語(yǔ)音準(zhǔn)確記錄下來,還能通過語(yǔ)義識(shí)別技術(shù)進(jìn)行“句讀”,較為準(zhǔn)確地使用標(biāo)點(diǎn)符號(hào)。
  與手機(jī)語(yǔ)音輸入相比,會(huì)場(chǎng)語(yǔ)音記錄的難度更大。因?yàn)樵跁?huì)場(chǎng)上有許多噪音,需要通過加混響、去混響等技術(shù)降低噪音,辨識(shí)出演講者的語(yǔ)音,再把這些語(yǔ)音轉(zhuǎn)換成文字。目前,國(guó)內(nèi)這種產(chǎn)品已經(jīng)成熟,能取代速記員。“按照‘每個(gè)字記錄得是否準(zhǔn)確’這個(gè)標(biāo)準(zhǔn),速記員的準(zhǔn)確率通常不超過80%,而訊飛的準(zhǔn)確率達(dá)到95%。”程蘇說。
  他還透露,今年底,訊飛將發(fā)布一款能替代同聲傳譯的產(chǎn)品。“屆時(shí),會(huì)場(chǎng)上將有兩塊屏幕,一塊顯示中文,另一塊顯示英文,讓大家對(duì)機(jī)器同傳的準(zhǔn)確率一目了然。”據(jù)介紹,要實(shí)現(xiàn)機(jī)器同傳,除了語(yǔ)音識(shí)別、語(yǔ)義識(shí)別技術(shù)外,還需機(jī)器翻譯、語(yǔ)音合成兩種技術(shù)。在專業(yè)性不強(qiáng)的會(huì)議上,機(jī)器同傳已能取代人工,節(jié)省許多會(huì)務(wù)費(fèi)用。而在專業(yè)會(huì)議上,這種系統(tǒng)需要前期接受大數(shù)據(jù)訓(xùn)練,標(biāo)注出專業(yè)術(shù)語(yǔ),這樣在現(xiàn)場(chǎng)就能應(yīng)付自如了。
  據(jù)介紹,語(yǔ)音識(shí)別結(jié)合機(jī)器翻譯的實(shí)用性很強(qiáng)。通過一些手機(jī)軟件,用戶能將多種外語(yǔ)以及我國(guó)少數(shù)民族語(yǔ)言的語(yǔ)音譯成漢語(yǔ),在一些交流場(chǎng)合,不再需要翻譯人員的幫助。
科大訊飛工作人員在展示一款語(yǔ)音產(chǎn)品。
科大訊飛工作人員在展示一款語(yǔ)音產(chǎn)品。來源:新華社
  從“感知”向“認(rèn)知”邁進(jìn)
  話務(wù)員、窗口服務(wù)員的工作也正在被智能語(yǔ)音系統(tǒng)取代。例如,撥打中國(guó)平安服務(wù)熱線“95511”后,用戶會(huì)聽到語(yǔ)音提示,讓他說出自己要辦理的業(yè)務(wù),說出后直接跳轉(zhuǎn)到相應(yīng)服務(wù),不再需要按鍵。又如,中國(guó)移動(dòng)的一些營(yíng)業(yè)廳已引入語(yǔ)音交互機(jī)器人,讓它們?yōu)橛脩艮k理各種業(yè)務(wù)。
  盡管如此,上海交通大學(xué)計(jì)算機(jī)系教授、思必馳聯(lián)合創(chuàng)始人俞凱表示,智能語(yǔ)音系統(tǒng)目前還只能取代部分語(yǔ)音交互服務(wù)崗位。其原因,是現(xiàn)實(shí)交流場(chǎng)景中,人們聽到的大多是“非配合式語(yǔ)音”——表達(dá)得并不清晰,講述的是復(fù)雜問題,常常需要多次交互,才能理解對(duì)方的意思。在這種場(chǎng)景下,目前的智能語(yǔ)音系統(tǒng)遠(yuǎn)沒有達(dá)到應(yīng)付自如的程度。為此,這一領(lǐng)域的科研人員正在從“感知”向“認(rèn)知”階段邁進(jìn),即在基本解決了語(yǔ)音識(shí)別問題后,著力增強(qiáng)這種系統(tǒng)的智能,使它們能更好地理解人類的自然語(yǔ)言。
  蘋果公司的作為,就反映了這一趨勢(shì)。去年,該公司收購(gòu)了英國(guó)公司VocalIQ,希望提高語(yǔ)音助手Siri的智能水平。在劍橋大學(xué)做科研時(shí),俞凱參與創(chuàng)辦了VocalIQ。這家公司開發(fā)的自然語(yǔ)言數(shù)據(jù)庫(kù)能存儲(chǔ)、學(xué)習(xí)用戶的語(yǔ)音信息,實(shí)現(xiàn)對(duì)用戶指令的準(zhǔn)確識(shí)別,并給出相應(yīng)的回復(fù)。“蘋果手機(jī)剛推出Siri那陣子,很多人喜歡和Siri開玩笑,因?yàn)樗鼤r(shí)常答非所問。”俞凱說,只有借助更先進(jìn)的語(yǔ)言認(rèn)知系統(tǒng),Siri才會(huì)變得更有用。
蘋果手機(jī)Siri的智能有望升級(jí)。
蘋果手機(jī)Siri的智能有望升級(jí)。來源:環(huán)球網(wǎng)
  物聯(lián)網(wǎng)時(shí)代,語(yǔ)音是剛需
  隨著智能語(yǔ)音系統(tǒng)的認(rèn)知能力越來越強(qiáng),它的用途越來越廣。另一方面,隨著物聯(lián)網(wǎng)時(shí)代的到來,智能語(yǔ)音交互將逐步成為人們生活中的“剛需”。俞凱分析說,我們已經(jīng)歷兩個(gè)互聯(lián)網(wǎng)時(shí)代——PC(個(gè)人電腦)互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng),在第一個(gè)時(shí)代,我們用鍵盤、鼠標(biāo)輸入信息;在第二個(gè)時(shí)代,通過手指觸摸、虛擬鍵盤輸入信息。由此可見,語(yǔ)音輸入不是“剛需”,盡管一些智能語(yǔ)音軟件的準(zhǔn)確率很高,但用戶比例還是比較低的。然而,人類即將迎來硬件物聯(lián)網(wǎng)時(shí)代。在這個(gè)時(shí)代,許多智能硬件沒有屏幕,即便有,在一些場(chǎng)景中也會(huì)離用戶比較遠(yuǎn),語(yǔ)音交互就會(huì)成為最便捷的操控方式。
\
  為了滿足這一未來需求,國(guó)內(nèi)外很多企業(yè)正在垂直領(lǐng)域發(fā)力,開發(fā)具有更多智能功能的語(yǔ)音產(chǎn)品。科大訊飛、思必馳開發(fā)的車載系統(tǒng),就是一個(gè)典型的垂直領(lǐng)域。在汽車?yán),駕駛員無(wú)法用手操作設(shè)備,語(yǔ)音操控的需求很大。據(jù)介紹,思必馳去年推出了可糾正、可打斷的交互系統(tǒng),用戶能隨時(shí)打斷語(yǔ)音助手、糾正自己的錯(cuò)誤。如在車上撥打電話時(shí),用戶說出號(hào)碼后,語(yǔ)音助手重復(fù)這個(gè)號(hào)碼時(shí),用戶可以打斷它并進(jìn)行修正(如說“不是135,是136”),而系統(tǒng)能理解這句話的意思。“我們希望在車載通話、聽音樂等垂直領(lǐng)域不斷取得突破,同時(shí)通過高?蒲,提高系統(tǒng)在開放領(lǐng)域的語(yǔ)言認(rèn)知水平,迎接物聯(lián)網(wǎng)時(shí)代的到來。”俞凱說。

專題