您當(dāng)前的位置是:  首頁(yè) > 資訊 > 文章精選 >
 首頁(yè) > 資訊 > 文章精選 >

人工智能和語(yǔ)音技術(shù)在Enterprise Connect 2022上盛行

2022-04-02 09:16:14   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  CTI論壇(ctiforum.com)(編譯/老秦):Jon Arnold的第五期“語(yǔ)音和語(yǔ)音識(shí)別市場(chǎng)現(xiàn)狀”向Enterprise Connect 2022與會(huì)者傳達(dá)了一條信息:無(wú)論是好是壞,對(duì)話式AI都改變了客戶參與度。
  Arnold開始了他的“語(yǔ)音技術(shù)在今天的發(fā)展方向是什么”會(huì)議,他解釋了為什么企業(yè)正在駕馭從聊天機(jī)器人到虛擬助手再到對(duì)話式AI的進(jìn)化浪潮。
  Arnold的結(jié)論是,談到語(yǔ)音識(shí)別技術(shù),“人工智能帶來(lái)了各種新事物……這是一個(gè)正在發(fā)生的空間……它不會(huì)消失,也不應(yīng)該消失。”他在聊天機(jī)器人和對(duì)話式人工智能虛擬助手之間建立了對(duì)比;聊天機(jī)器人是事務(wù)性的、封閉式的、結(jié)構(gòu)化的、算法的,并且可以復(fù)制預(yù)先存在的對(duì)話,而虛擬助手是對(duì)話式的、開放式的和非結(jié)構(gòu)化的。
  雖然Arnold說(shuō)與去年相比沒有太大變化,但他指出企業(yè)語(yǔ)音技術(shù)生態(tài)系統(tǒng)正在興起。生態(tài)系統(tǒng)包括純玩兒家(Deepgram、Dubber、LumenVox、Otter.ai、Rev.ai、Speechmatics、Verbit)、主要平臺(tái)(AAWS-Amazon Lex、Google、IBM-Watson Assistant、Microsoft-Azure Cognitive Services)和UCaaS提供商(Avaya、Cisco Webex、Dialpad AI、Microsoft Teams、Zoom)。
  “如果你不了解這些公司,你應(yīng)該知道,”Arnold說(shuō),并補(bǔ)充說(shuō)翻譯和轉(zhuǎn)錄是他們產(chǎn)品中的標(biāo)準(zhǔn)組件。
  語(yǔ)音技術(shù)在企業(yè)中的應(yīng)用
  到目前為止,大多數(shù)企業(yè)用例都圍繞客戶服務(wù)、聯(lián)絡(luò)中心和客戶體驗(yàn)展開。Arnold提供的數(shù)據(jù)展示了語(yǔ)音技術(shù)的前五個(gè)領(lǐng)先用例,這些用例超越了以客戶為中心的交互:網(wǎng)絡(luò)會(huì)議轉(zhuǎn)錄、客戶體驗(yàn)和分析、字幕和隱藏式字幕、教育、學(xué)術(shù)和研究轉(zhuǎn)錄以及醫(yī)療轉(zhuǎn)錄。其他顯示出最大商業(yè)影響的用例是消費(fèi)電子產(chǎn)品、合規(guī)性、法律轉(zhuǎn)錄和媒體監(jiān)控等等。
  Arnold還強(qiáng)調(diào)了以下四個(gè)重點(diǎn)關(guān)注協(xié)作和生產(chǎn)力的核心企業(yè)應(yīng)用程序:用于會(huì)議的語(yǔ)音轉(zhuǎn)文本應(yīng)用程序、虛擬助手、用于會(huì)話分析的自動(dòng)語(yǔ)音識(shí)別和實(shí)時(shí)翻譯。
  Arnold通過(guò)討論如何使工作場(chǎng)所更具包容性,解釋了語(yǔ)音轉(zhuǎn)文本對(duì)于會(huì)議、轉(zhuǎn)錄和視頻字幕的重要性。“突然之間,虛擬桌面環(huán)境對(duì)任何人和每個(gè)人都非常強(qiáng)大”,它可以讓殘疾人使用其他人擁有的相同工具和信息流。
  虛擬助理會(huì)記筆記,因此您不必這樣做,“數(shù)字助理將成為您的私人秘書。”最重要的是,Arnold解釋說(shuō)搜索功能將語(yǔ)音轉(zhuǎn)換為數(shù)據(jù)流。一旦語(yǔ)音可搜索,就可以更輕松地篩選語(yǔ)音數(shù)據(jù)并自動(dòng)執(zhí)行與會(huì)議相關(guān)的任務(wù)。
  Arnold說(shuō)最大的商業(yè)影響是圍繞網(wǎng)絡(luò)會(huì)議轉(zhuǎn)錄。“人工智能已經(jīng)將語(yǔ)音識(shí)別的質(zhì)量提高到了在復(fù)制人類語(yǔ)音方面提高了95%的程度。”他繼續(xù)以亞馬遜的Alexa或蘋果的Siri為例。“你可以與那個(gè)虛擬助手交談,而不是[對(duì)著助手]吠叫,他可以為你做事、回應(yīng),甚至在他們認(rèn)為你需要知道的事情時(shí)提示你,比如你的會(huì)議即將開始,要遲到了。”
  理解虛擬助手所說(shuō)內(nèi)容的下一層是自動(dòng)語(yǔ)音識(shí)別(ASR)--虛擬助手可以自動(dòng)識(shí)別語(yǔ)音,因?yàn)樗呀?jīng)通過(guò)機(jī)器學(xué)習(xí)編程來(lái)理解并用它做一些事情。然后你有對(duì)話分析的ASR,這是你試圖理解助手所說(shuō)的下一層。Arnold解釋說(shuō),“這是我們了解上下文、意圖和理解一個(gè)人說(shuō)話時(shí)的意思的地方。”他補(bǔ)充說(shuō),僅僅捕捉措辭是不夠的--你必須知道一個(gè)人想說(shuō)什么。
  人工智能和語(yǔ)音技術(shù)的發(fā)展方向:超越協(xié)作
  在解釋語(yǔ)音技術(shù)的發(fā)展方向時(shí),Arnold強(qiáng)調(diào)了沉浸式模型和元宇宙。當(dāng)我們的工作日在物理世界開始和結(jié)束時(shí),增強(qiáng)現(xiàn)實(shí)即將出現(xiàn)。Arnold以Cisco Webex Hologram為例,它可以通過(guò)提供真實(shí)人物的逼真的實(shí)時(shí)全息圖來(lái)營(yíng)造一種共存感。這種全息圖、虛擬投影圖像、人的虛擬投影的想法,這樣你就可以和你的隊(duì)友在房間里,“這是突破性的東西,”Arnold說(shuō)。“人工智能的可能性變得越來(lái)越有趣,因?yàn)檠坨R正在將虛擬元素帶入您的工作流程。”
  Microsoft Mesh for Teams,或者如Arnold所指的那樣--微軟對(duì)虛擬世界的大力推動(dòng)--是沉浸式模型的另一面。“這是微軟進(jìn)入后PC世界的舉措,因?yàn)樗麄冎繮C在某些時(shí)候會(huì)消失,”Arnold說(shuō)。“有趣的是人和化身的混合......所以虛擬世界和物理世界越來(lái)越接近......越來(lái)越難以關(guān)心差異。”
  Meta在工作場(chǎng)所協(xié)作空間中已經(jīng)完全虛擬化,因?yàn)?ldquo;它是另一個(gè)具有這些技術(shù)用例的應(yīng)用程序,”Arnold說(shuō)。這有點(diǎn)游戲化,因?yàn)榛眍愃朴谀九疾⑶已勘磺袛,但Arnold認(rèn)為這是一種有趣的工作方式,人們可以通過(guò)這種方式有效地工作。Meta幾乎完全處于虛擬世界中,Arnold告訴與會(huì)者,如果你愿意嘗試一下,“你可能會(huì)驚訝于你當(dāng)時(shí)能做多少事情。”
  Arnold解釋說(shuō),元宇宙的想法是關(guān)于利益的。“你將賭注押在人們想要社交的地方,以及從那里開始,他們想要在哪里工作和做生意。”
  Arnold指出,英偉達(dá)在GPU方面占上風(fēng),這使計(jì)算機(jī)處理速度更快,“因?yàn)檫@就是人工智能的全部意義所在,”他說(shuō)。Arnold解釋說(shuō),特別是對(duì)于人工智能,“你需要很大的馬力”,而缺乏馬力是一種后備力量。例如,“只有在PC能夠以足夠快的速度處理大規(guī)模的數(shù)據(jù)變化以提供良好的體驗(yàn)之前,元宇宙才能運(yùn)行。”Arnold指出,下一代計(jì)算機(jī)將專門用于支持諸如馬力之類的東西,無(wú)論元宇宙采取何種形式,“聲音將是采用的核心。”
  人工智能采用:需要牢記的注意事項(xiàng)
  Arnold還談到了人工智能如何走向正確和錯(cuò)誤的方向。他設(shè)定了許多相反的結(jié)果--有意跟蹤與無(wú)意監(jiān)控,損害隱私的技術(shù)與提高生產(chǎn)力的技術(shù),自動(dòng)化工作的技術(shù)與激發(fā)員工創(chuàng)造力的技術(shù),以及增強(qiáng)用戶信任的技術(shù)與削弱信任的技術(shù)。
  “那些整天運(yùn)行的桌面設(shè)備,捕捉旁白,突然成為頂級(jí)監(jiān)控技術(shù),”他說(shuō),并強(qiáng)調(diào)企業(yè)必須注意這一點(diǎn)。“不是因?yàn)樗梢宰鍪裁,而是因(yàn)閱T工如何看待你正在嘗試做的事情。”Arnold解釋了為什么企業(yè)必須透明地將這項(xiàng)技術(shù)用于正確的目的,因?yàn)?ldquo;你不想損害隱私”。
  他建議企業(yè)將精力集中在識(shí)別深度造假上,而不是驗(yàn)證什么是真實(shí)的,因?yàn)殡S著創(chuàng)新而來(lái)的是好人和壞人。“技術(shù)是中立的,但人工智能偏見會(huì)使事情復(fù)雜化。”
  人工智能現(xiàn)在正在推動(dòng)各種形式的技術(shù),包括協(xié)作等企業(yè)用例。Arnold指出,身臨其境的合作即將到來(lái),“大玩家正在實(shí)現(xiàn)它”。他補(bǔ)充說(shuō),“人工智能走到哪里,語(yǔ)音技術(shù)就會(huì)緊隨其后。”同樣,他在這個(gè)空間中的最后念頭也以一句話結(jié)束。“消費(fèi)者走到哪里,企業(yè)就跟到哪里。”主要參與者都在押注這些新模型會(huì)成功--所以要做好準(zhǔn)備。
  聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
  原文網(wǎng)址:
  https://www.nojitter.com/ai-speech-technologies/ai-speech-tech-prevail-enterprise-connect-2022
 
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)