首頁>>廠商>>語音識別與合成>>科大訊飛

訊飛語音讓MP3開口說話

2009/04/30

  CTI論壇(ctiforum)04月30日消息: 通過語音技術(shù)徹底改變用戶和音樂播放器之間的互動方式,讓MP3“開口說話”,這既是使用者的應(yīng)用需求熱點,也是各MP3 廠商焦點關(guān)注的產(chǎn)品發(fā)展趨勢。日前,蘋果公司發(fā)布了新一代便攜音樂播放產(chǎn)品iPod shuffle 3,其最大亮點就是搭載了VoiceOver語音交流功能,實現(xiàn)了“開口說話”。當(dāng)然,這并非蘋果的“獨門絕技”;诳拼笥嶏w公司國際領(lǐng)先的智能語音技術(shù),可以使MP3\MP4\PMP類產(chǎn)品輕松具有比iPod shuffle 3更為強大的語音功能,科大訊飛正在與眾多產(chǎn)品廠商開展此方面的合作。

  MP3能夠開口說話,對于消費者而言,可以用“聽”代替“看”獲取信息,例如你在聽一首歌,想知道歌曲的名稱和表演者的名字,只要輕輕按一下按鍵,VoiceOver 就會告訴你相關(guān)信息,并且不會打斷正在播放的音樂。此外,與語音技術(shù)的結(jié)合也使找到所要的音樂更加方便快捷,特別是在運動、走路等情況下,不需要轉(zhuǎn)移注意力就可以輕松找到想要聽的音樂。對于開發(fā)廠商而言,機器上可以省去顯示屏,節(jié)約了成本,同時機型可以更小、更輕便與精美,電池使用時間也會大大提升。

  對于會說話的MP3,國內(nèi)MP3開發(fā)廠商無需艷羨,應(yīng)用訊飛語音技術(shù)完全可以輕松實現(xiàn),并實現(xiàn)效果、功能的優(yōu)化與超越,為產(chǎn)品賦予吸引消費者眼球的亮點、賣點。語音合成技術(shù),簡稱TTS(Text To Speech)技術(shù),該技術(shù)解決了如何將文字信息轉(zhuǎn)化為聲音信息的問題,讓人們獲取信息的方式更加豐富與自然。科大訊飛智能語音技術(shù)代表了全球最高水平,中文語音合成技術(shù)在近年來歷屆國內(nèi)、國際權(quán)威機構(gòu)的評測中,主要關(guān)鍵技術(shù)指標(biāo)均名列第一,2005年在業(yè)界首次超過普通人口語水平(普通人口語自然度得分4.0分,訊飛中文語音合成技術(shù)自然度達到4.3分)?拼笥嶏w在英文語音合成方面也取得了穩(wěn)固的國際領(lǐng)先優(yōu)勢,已連續(xù)3年獲得國際英文合成大賽第一名。

  應(yīng)用了科大訊飛語音合成技術(shù)的MP3除了歌曲歌手名稱播報之外,還可以進行當(dāng)前狀態(tài)播報,獲取當(dāng)前電池電量、時間或錄音時間等信息。例如,當(dāng)沉醉于音樂而不知道具體時間的時候,只要輕松按鍵,音樂播放器就會自如的告訴你,這些操作均不會打斷正在播放的音樂。此外,與訊飛語音技術(shù)的結(jié)合還大大拓展了MP3的應(yīng)用功能,用戶可以下載各類書籍、新聞、信息存儲到MP3中,利用語音功能“變看為聽”,使MP3不僅是音樂播放器,更成為以“聽”的方式獲取更多娛樂和信息的綜合性產(chǎn)品。

  經(jīng)過10年的技術(shù)積累,科大訊飛已推出了從大型電信級應(yīng)用到小型嵌入式應(yīng)用,從電信、金融等行業(yè)到企業(yè)和家庭用戶,從PC到手機到MP3/MP4/PMP和玩具,能夠滿足不同應(yīng)用環(huán)境的多種產(chǎn)品,為千百萬用戶帶來了無限驚喜,享受到了語音技術(shù)的獨特魅力與重大應(yīng)用價值。

  借助科大訊飛智能語音技術(shù),使讓國內(nèi)廠商的MP3開口說話,以至實現(xiàn)完整的人機語音互動、全面超越iPod shuffle 3成為一種可能。強大的語音功能,將使得MP3的使用價值得到巨大提升,成為新一代MP3的最大亮點與賣點。“會說話”MP3 將徹底改變消費者瀏覽與欣賞音樂的方式,進一步加強消費者與音樂之間的互動,從而給消費者帶來更便捷、更時尚的新潮體驗。

CTI論壇報道