首頁>>>技術(shù)>>>語音應(yīng)用>>>語音合成(TTS)  語音合成產(chǎn)品

Google翻譯工具憑啥跨越語言障礙

2011/03/29

  出國旅游不懂當(dāng)?shù)卣Z言怎么辦?沒有問題,只要你的手機(jī)上裝有Google(谷歌)翻譯工具,你對著它說句中文,它就能立刻翻譯成當(dāng)?shù)卣Z言,并直接“念”出來。

  Google翻譯這款產(chǎn)品誕生至今,一直在堅持創(chuàng)新,從網(wǎng)頁版到工具欄,再發(fā)展到今天移動版,虛擬鍵盤、可選擇翻譯、朗讀等功能也相繼推出!癎oogle希望支持用戶多樣化的輸入和輸出,以便更加輕松地跨越語言的障礙!苯,Google翻譯研發(fā)經(jīng)理陳雍昇在位于北京清華科技園的Google北京辦公室接受了《計算機(jī)世界》的專訪,為我們揭開了Google翻譯背后的技術(shù)面紗及其所承載的Google整體產(chǎn)品戰(zhàn)略的重要使命。

  懂得更多 全憑云統(tǒng)計

  2004年,Google創(chuàng)始人之一塞吉·布林(Sergey Brin)使用市面上的網(wǎng)絡(luò)翻譯服務(wù)來翻譯韓國粉絲的郵件,結(jié)果顯示:“生魚片帶著它的愿望,用Google搜索綠洋蔥!”。這一與原意風(fēng)馬牛不相及的翻譯結(jié)果使塞吉下定決心要使Google做出靠譜的翻譯產(chǎn)品。

  如今,Google翻譯早已是很多人出國旅行和外文寫作的必備工具,而Google也成為世界上最大的在線翻譯服務(wù)提供商,實(shí)現(xiàn)了跨語言搜索信息,并可將搜索結(jié)果和網(wǎng)頁等資訊以母語傳遞給用戶。目前,全世界超過1000萬人使用的語言約100種,而Google翻譯已經(jīng)實(shí)現(xiàn)了對其中58種語言的支持!半m然機(jī)器翻譯并不完美,但它可以讓非母語用戶接觸到之前無法觸及的世界各地的信息。”

  “值得注意的是,Google翻譯是個自動翻譯機(jī),也就是說,它借助的是技術(shù)而非人力! 陳雍昇指出,當(dāng)下大部分的商業(yè)翻譯系統(tǒng)都屬于規(guī)則法機(jī)器翻譯,需要做大量詞匯與語法的工作。不同于它們,Google翻譯是先往計算機(jī)內(nèi)輸入大量的文字文本,涵蓋目標(biāo)語言的文本和對應(yīng)翻譯文本中現(xiàn)有的人工翻譯數(shù)據(jù),然后構(gòu)建統(tǒng)計翻譯模型。

  每年,Google都會從一些政府部門、學(xué)術(shù)機(jī)構(gòu)搜集翻譯信息,完善自己的平行語料庫,所謂的平行語料就是兩種語言的對應(yīng)詞組或者句子,比如,“l(fā)ong”的平行語料是“長”、“time”的平行語料是“時間”,但詞組“l(fā)ong time”的平行語料卻不能只是兩個單詞的拼接,而是“很久”,句子“I have been here for a long time.”的平行語料則是“我已經(jīng)在這里很長一段時間。”而為了保證翻譯質(zhì)量,除了嚴(yán)格限制平行語料的來源,Google還采用了國際認(rèn)定標(biāo)準(zhǔn)Bleu Score來分析、調(diào)試平行語料的質(zhì)量。

  在采訪中,陳雍昇特別指出,Google翻譯之所以采用統(tǒng)計翻譯模型一個重要原因就是Google的云計算架構(gòu)。機(jī)器翻譯需要海量的數(shù)據(jù)存儲空間以及高效的運(yùn)算能力,而Google擁有GoogleMapReduce(分布式計算系統(tǒng)) 和BigTable(分布式存儲系統(tǒng))正好滿足了這兩方面需求。

  所以從表面上看,支持的語言種類多和必須在線使用是Google在功能上與市面上同樣流行金山詞霸、有道詞典等翻譯工具的功能區(qū)別,但背后最大的不同卻是,Google在云計算支撐下的統(tǒng)計翻譯模型。

  整合信息 人人皆受益

  “整合全球信息,使人人皆可訪問并從中受益,這是Google的始終秉持的信條,也是它的產(chǎn)品戰(zhàn)略”,陳雍昇表示Google翻譯雖然并不是Google最大的研發(fā)部門,但它與Android、Chrome甚至Youtube一樣,都是為Google實(shí)現(xiàn)整合全球信息的目標(biāo)服務(wù)的。

  Google希望將分散在全球各地的,所有可以數(shù)字化的,不同語言、不同格式、不同類型、不同版本的信息,進(jìn)行分析處理后,以最簡便的方式提供給用戶使用,無論這些內(nèi)容是來自某個地區(qū)的方言、書本或多媒體的內(nèi)容,或是地圖等基本的生活信息。這也可以解釋為什么每次技術(shù)論壇上,Google都會在翻譯這款產(chǎn)品上大費(fèi)唇舌,因?yàn)樗砹艘环N理想化的溝通形態(tài),即全球信息的無障礙流通。

  回到翻譯這款產(chǎn)品,有數(shù)據(jù)顯示,世界上超過99%的人每天的溝通都要靠母語,但在互聯(lián)網(wǎng)上,英文信息占了80%,在剩下的20%中,法語占其中的大約5%,中文等其他語言信息所占百分比微不足道,至于其中的精華信息,更是少之又少。以阿拉伯語為例,世界上有8%的人說阿拉伯語,但是只有1%的網(wǎng)站使用阿拉伯語。這就是Google為什么如此重視一款小小的語言工具——為了讓每個人都能無語言障礙地,輕松地訪問網(wǎng)頁。

  而除了對不同類型、不同語言信息的橫向整合,Google還強(qiáng)調(diào)對自己的產(chǎn)品體系進(jìn)行縱向縱橫。從2010年開始,有不少用戶發(fā)現(xiàn),Google已經(jīng)在Chrome瀏覽器中整合了Google翻譯。當(dāng)Chrome用戶訪問與電腦系統(tǒng)默認(rèn)語言(或是瀏覽器語言)不同的其他語種網(wǎng)站時,Chrome瀏覽器就會出現(xiàn)Google翻譯工具欄,只要單擊“翻譯”按鈕,Google翻譯將把整個網(wǎng)站翻譯為系統(tǒng)默認(rèn)語言。當(dāng)然,用戶也可以讓Google翻譯將把整個網(wǎng)站翻譯為其他語言。

  此外,據(jù)記者了解,目前,Google 翻譯可以幫助用戶閱讀搜索結(jié)果、網(wǎng)頁、電子郵件、YouTube視頻字幕以及其他信息,用戶甚至還能在Gmail內(nèi)進(jìn)行實(shí)時的多語言對話。事實(shí)上,剛剛在蘋果AppStore上線Google翻譯并不是第一個移動版,因?yàn)樵缭谝荒昵,Google就已經(jīng)在自己的移動操作系統(tǒng)Android推出了Google翻譯工具,而今年Android 版Google翻譯又再接再厲推出了聊天模式(Conversation Mode)(目前只支持英語和西班牙語之間的互譯),其主要功能是讓使用者透過 Android 手機(jī)來實(shí)時翻譯,為原本語言不通的人建立溝通橋梁。

  “在未來,而眾所周知,在現(xiàn)實(shí)中的翻譯行業(yè),專業(yè)化、個性化是很重要的一環(huán)!痹诓稍L的最后,陳雍昇也表示,除了堅持在翻譯質(zhì)量、速度、用戶體驗(yàn)方面進(jìn)一步挖掘潛力,未來Google也正在翻譯個性化上努力,以提供給用戶更多樣、精準(zhǔn)的選擇。

計算機(jī)世界



相關(guān)閱讀:
美國移動支付系統(tǒng)制造商VIVOtech準(zhǔn)備2012年上市 2011-03-29
黑莓將在廣東推個人服務(wù) 已進(jìn)入最后準(zhǔn)備階段 2011-03-29
多家銀行上線iPhone手機(jī)銀行客戶端 爭奪高端用戶 2011-03-29
卓望醞釀業(yè)務(wù)調(diào)整 夢網(wǎng)模式或終結(jié) 2011-03-29
移動社交應(yīng)用市場進(jìn)入“虛熱”階段? 2011-03-29

熱點(diǎn)專題:  語音合成TTS 語音識別ASR    移動增值
分類信息:  移動增值_與_語音應(yīng)用  移動增值_與_互聯(lián)網(wǎng)  移動增值_與_移動  移動增值_與_互聯(lián)網(wǎng)
相關(guān)頻道:  增值電信新聞