您當(dāng)前的位置是:  首頁 > 資訊 > 國際 >
 首頁 > 資訊 > 國際 >

印度人要做“語音版 Quora”,如何讓它聽懂印度的眾多方言?

2019-04-04 10:02:44   作者:   來源:36kr   評論:0  點擊:


  目前GoogleAssistant支持的32種語言中,包括9種印度官方語言,而這些印度本地公司想做更多。
  編者按:本文作者 Vishal Krishna,原文標(biāo)題:Indian Languages need a voice online. Here's how homegrown startups are giving them one.
  在13億印度人中,真正會說英語的人不到1億,不管你參考的是哪份報告。
  印度的大多數(shù)網(wǎng)站和應(yīng)用還必須使用英語操作,但現(xiàn)在變化正在發(fā)生——所有的數(shù)字和在線產(chǎn)品/服務(wù)都在向印度本地的語言過渡。這種變化吸引了新的用戶,但是本土語言的使用還面臨一個重要挑戰(zhàn)。
  這個挑戰(zhàn)就是語音。
  印度人要做“語音版Quora”,怎么讓它聽懂印度的眾多方言?
圖片來源:YourStory
  不僅是印度,全世界的初創(chuàng)公司和開發(fā)人員都在大力投資語音技術(shù)。語音技術(shù)省掉了用戶打字的麻煩,能打開全新的用戶市場——包括那些還不懂ABC的小孩子,以及不太會用手機鍵盤的老年人等等。
  搜索巨頭Google目前支持9種印度語言,而Amazon也在構(gòu)建基于語音技術(shù)的各種功能。
  而印度需要的不僅僅是語言支持和語音技術(shù)。像人們常說的“內(nèi)容為王”,對一種語言進(jìn)行精確識別需要足夠的數(shù)據(jù)來訓(xùn)練,而印度有多達(dá)17種官方語言(編者校:印度憲法認(rèn)定的官方語言有22種)和數(shù)百種被認(rèn)可的方言。如果想打動印度的消費者,對這些不同語言的語音識別是必經(jīng)之路,盡管這并不容易。
  為了彌合這一缺口,幾家初創(chuàng)公司正在幫印度人打造使用本地語言的搜索工具,畢竟每個人都希望為自己的問題搜索到明確的答案。這項工作的難點是:印度缺少使用本地語言的內(nèi)容,或者說數(shù)據(jù)。
  班加羅爾的Vokal就是這樣一家公司。Vokal由Aprameya Radhakrishna和Mayank Bidawatka創(chuàng)立。用戶可以在該平臺上使用印度本土語言提問,然后會有其他用戶用同樣的語言做出解答。簡言之,Vokal就好比印度版的Quora,不過Quora是純文字問答平臺,而Vokal則是純語音問答。
  “語音是未來。印度的農(nóng)村居民會更喜歡用語音搜索來尋找感興趣的內(nèi)容。目前,如果你不會英語,你就很難在各大平臺上搜索和獲取信息。”Aprameya說。他補充說,Vokal花費了大量時間來訓(xùn)練機器學(xué)習(xí)算法,使其能理解各種提問并顯示相關(guān)回答。
  推薦閱讀:報告:在亞太地區(qū),中國人不如印度人愛用語音助手
  YourStory嘗試了Vokal的埃納德語和泰盧固語語音搜索,用它查找了烹飪、農(nóng)作、旅行和健康生活指導(dǎo)等方面的內(nèi)容。和任何初創(chuàng)公司一樣,Vokal還需要一些時間才能獲得足夠的用戶和用戶使用數(shù)據(jù),進(jìn)而優(yōu)化其AI搜索引擎,達(dá)到99%的準(zhǔn)確率,但它已經(jīng)走出了第一步。投資者顯然也是這么看的,Vokal成立才不到一年半,就已經(jīng)從Kalaari Capital、Accel Partners、順為資本和Blume Venture等投資機構(gòu)獲得了大約700萬美元的融資。
  除Vokal外,一些其他的創(chuàng)業(yè)公司也在開發(fā)基于語音的技術(shù)。Reverie Techonologies幾年前就成功推出了用于手機的印地語輸入法,這種本地化的輸入法廣受歡迎。最近該公司被Reliance Industries以19億盧比(約2772萬美元)高價收購。收購背后的原因正是Reverie正在開發(fā)的、支持本地語言的語音銀行服務(wù)工具。
  Reverie開發(fā)的所有產(chǎn)品和功能的使用場景都是基于具體設(shè)備的(包括手機、平板、機頂盒、以及游戲和App的開發(fā)工具)。另外,Reverie還與高通、沃達(dá)豐和三星等公司合作,幫助它們提高旗下電子設(shè)備處理語言的能力。
  印度有許多初創(chuàng)公司都在對語音技術(shù)進(jìn)行探索,但其功能各有不同。比如Gnani。AI,這家公司一直專注于B2B業(yè)務(wù),但現(xiàn)在它正計劃為農(nóng)戶推出B2C服務(wù),讓他們能夠用本地語言咨詢有關(guān)農(nóng)作物的問題。
  更有意思的是,Gnani.AI還在嘗試用手機進(jìn)行語音翻譯和信息讀取。也就是說用戶可以將一段語音消息轉(zhuǎn)換為文字,然后將其分享給WhatsApp上的好友。假如有一名用戶會說埃納德語,但卻不會寫,那他/她只要對著Gnani的平臺講話,就能將語音轉(zhuǎn)換為埃納德語文字。
  除了官方語言,Gnani平臺也可以將方言轉(zhuǎn)換為文字內(nèi)容。目前,Gnani的主要使用語言是埃納德語,但未來肯定會擴充更多語言。
  “我們還在對產(chǎn)品進(jìn)行測試,完善算法,以求輸出最準(zhǔn)確的(翻譯)結(jié)果。”Gnani。AI的聯(lián)合創(chuàng)始人Ganesh Gopalan表示。
  重量級企業(yè)玩家中,想要占據(jù)語音和地方語言市場的也不止收購了Reverie的RelianceIndustries一家。去年,F(xiàn)lipkart收購了Liv.AI,F(xiàn)lipkart的首席執(zhí)行官Kalyan Krishnamurthy表示,Liv。AI可以使用支持當(dāng)?shù)卣Z言的語音技術(shù)來完成交易、進(jìn)行付款、提供客戶服務(wù)以及與賣家互動。Liv.ai由Subodh Kumar、Sanjeev Kumar和Kishore Mundra三人聯(lián)合創(chuàng)辦,該公司將來會幫助Flipkart以本地語言與顧客交流,不管是通過語音還是文字。
  Vernacular。ai則代表了語音應(yīng)用的另一種可能。Vernacular想建立一個可以應(yīng)對印度不同語言的自動化呼叫中心。目前它可以自動化對幾家賓館和餐廳的預(yù)約,客人只需說出自己的需求就可進(jìn)行預(yù)約,而不用在線上等著和客服交流。
  根據(jù)一篇《語音識別市場》的報告,語音技術(shù)市場預(yù)計將從2018年的75億美元增長到2024年的215億美元,復(fù)合年增長率為19.18%。對語音識別市場強勁增長的預(yù)期有很多原因,包括其在醫(yī)療保健類應(yīng)用方面的潛力、手機銀行類應(yīng)用中不斷增長的對語音認(rèn)證需求、多功能設(shè)備和智能音箱的快速普及,以及在AI幫助下不斷提高的語音識別的準(zhǔn)確性。
  該報告補充說,微觀語言學(xué)、教育和自動駕駛等領(lǐng)域都可能為語音識別公司創(chuàng)造巨大的增長機會。
  在印度,隨著使用移動流量的用戶指數(shù)級增長,本地語言的使用需求會越來越大,有太多的場景會需要用到本地語言,F(xiàn)在行業(yè)內(nèi)的所有的努力——不僅包括Google和Amazon等巨頭的努力,也包括本地初創(chuàng)公司的努力——都是未來市場所必需的。希望很快印度人能夠以本地語言搜索信息并獲得本地化的答案。
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)