您當(dāng)前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

2022年語音技術(shù)行業(yè)現(xiàn)狀之人工智能

2022-04-21 10:14:28   作者:   來源:CTI論壇   評論:0  點擊:


  CTI論壇(ctiforum.com)(編譯/老秦):語音技術(shù)每年都在突飛猛進(jìn)地發(fā)展。2021年也不例外,創(chuàng)新的速度比預(yù)期的要快,這在很大程度上要歸功于人工智能(AI)的進(jìn)步。這一進(jìn)展派上了用場,尤其是在COVID-19危機持續(xù)到2022年以及消費者和企業(yè)越來越依賴嵌入到由人工智能驅(qū)動的應(yīng)用程序、平臺和設(shè)備中的語音的情況下。
  “基于語音的解決方案結(jié)合了自然語言處理(NLP)以實現(xiàn)語言理解和情感認(rèn)知,已被用于解決大流行期間出現(xiàn)的心理健康問題。”ETS人工智能實驗室執(zhí)行主任Narmeen Makhani說:“對客戶服務(wù)解決方案的需求不斷增加,加上勞動力短缺和供應(yīng)鏈問題,也加速了企業(yè)采用和依賴基于人工智能的會話座席。這些座席幫助增強了客戶體驗,提高了客戶支持和語音識別工具的效率和定制化。”
  事實上,對話式AI座席已成為大多數(shù)公司的主流。Makhani說,基于人工智能的語音技術(shù)的進(jìn)步,例如設(shè)備上自動語音識別(ASR)、無文本模型和大型語言模型,為銀行、醫(yī)療保健和教育領(lǐng)域開辟了新的可能用例。
  Read Speaker北美總裁Matt Muldoon對此表示贊同。“隨著酒店、汽車和客戶服務(wù)等垂直行業(yè)更廣泛地采用語音技術(shù),智能家居控制、體驗營銷和游戲等,其他垂直行業(yè)正在認(rèn)識到在向用戶提供的產(chǎn)品中利用人工智能支持的語音技術(shù)的好處,”他指出。
  Five9產(chǎn)品管理執(zhí)行副總裁Callan Schebella表示,過去幾年人工智能的進(jìn)步“是爆炸性的”。現(xiàn)在你可以用語音識別來做一些幾年前只能在實驗室里才能做到的事情。“
  “人工智能正在加速[Alexa和Siri等語音助手]的功能,因此,隨著時間的推移,Alexa和其他語音助手只會變得更聰明,”Netomi的創(chuàng)始人兼首席執(zhí)行官Puneet Mehta認(rèn)為。“與此同時,對于公司而言,保護(hù)性人工智能正被廣泛采用,以通過自動化日常任務(wù)來降低業(yè)務(wù)成本、提升客戶服務(wù)并節(jié)省員工時間,使他們能夠承擔(dān)更多創(chuàng)造性任務(wù)。”
  Gridspace的首席執(zhí)行官Evan Macmillan對此表示贊同。“商業(yè)客戶越來越了解對話式人工智能的可能性,并從全棧人工智能優(yōu)先產(chǎn)品公司尋求最佳解決方案,”他說。“企業(yè)也在以創(chuàng)紀(jì)錄的速度將語音工作負(fù)載轉(zhuǎn)移到云端,這為對話式人工智能和新流程自動化打開了大門。”
  年度回顧
  去年是人工智能和語音技術(shù)的關(guān)鍵一年,幾項突出的發(fā)展證明了這一點。一方面,Meta(Facebook)、谷歌和NVIDIA都加入了虛擬世界的潮流,推動了語音AI、計算機視覺、自然語言理解(NLU)和虛擬現(xiàn)實(VR)方面的創(chuàng)新,以創(chuàng)建能夠識別語音和與用戶交流。
  麥肯錫發(fā)現(xiàn),如今56%的企業(yè)至少在一項業(yè)務(wù)功能中使用人工智能,高于2020年的50%。近三分之二的企業(yè)計劃在未來三年內(nèi)增加對人工智能的投資。
  Gartner的一項調(diào)查發(fā)現(xiàn),36.3%的客戶服務(wù)領(lǐng)導(dǎo)者計劃到2023年部署人工智能。
  市場增長--由對語音激活系統(tǒng)、語音虛擬助手和語音設(shè)備的需求增加推動--繼續(xù)飆升。
  “隨著智能電器變得越來越普遍,企業(yè)利用人工智能來提高語音技術(shù)的準(zhǔn)確性,更多的消費者將傾向于在日常生活中使用它。該研究還表明,由于語音和語音設(shè)備成本的下降、軟件開發(fā)的增加以及對具有語音功能的虛擬助理智能揚聲器的持續(xù)需求,市場將得到顯著采用,”Muldoon說。
  然而,對于一些人來說,采用人工智能語音技術(shù)一直很困難,主要是由于缺乏基礎(chǔ)設(shè)施、技術(shù)限制和缺乏教育。
  “許多人并沒有完全掌握人工智能的全部好處及其在工作場所的使用。像大多數(shù)新興技術(shù)一樣......人工智能對許多人來說似乎很復(fù)雜,而且它仍處于起步階段,”Mehta說。
  Makhani認(rèn)為,語音技術(shù)的準(zhǔn)確性仍然是最大的挑戰(zhàn),尤其是對于非母語人士和兒童以及在有背景噪音的情況下。
  “此外,許多主流的、基于人工智能的語音設(shè)備繼續(xù)傾聽用戶的聲音。需要繼續(xù)解決在保護(hù)用戶隱私的同時始終保持響應(yīng)的挑戰(zhàn),以確保在人工智能的廣泛使用中滿足道德標(biāo)準(zhǔn),”Makhani說。“隨著人工智能技術(shù)變得越來越人性化,虛假內(nèi)容將會激增。由于現(xiàn)在在某些地區(qū)可以大規(guī)模創(chuàng)建虛假內(nèi)容,這可能會產(chǎn)生可怕的結(jié)果。從積極的方面來說,這項技術(shù)也可以用來識別虛假內(nèi)容。”
  數(shù)據(jù)隱私問題也繼續(xù)成為2021年的頭條新聞。
  “在利用人工智能時,網(wǎng)絡(luò)安全和數(shù)據(jù)隱私仍然是公司面臨的最大風(fēng)險,”Muldoon警告說。“公司需要明確傳達(dá)他們?nèi)绾伪Wo(hù)客戶的隱私和數(shù)據(jù),以幫助消費者更放心地使用這些解決方案,這有助于提高采用率,并幫助公司將AI擴展到其他業(yè)務(wù)功能以簡化運營。”
  企業(yè)仍在適應(yīng)由COVID引起的變化,語音技術(shù)可以幫助也可以阻礙。
  “隨著遠(yuǎn)程工作和虛擬活動被認(rèn)為是新常態(tài),公司仍在努力解決如何更好地與消費者和客戶建立聯(lián)系和互動。語音到文本的用例--從交互式筆記到市政廳字幕--通過使信息可搜索、可訪問和可操作,使組織能夠最大限度地發(fā)揮其音頻和視頻文件的潛力。但是需要持續(xù)的教育來最大限度地發(fā)揮這種潛力,”Verbit首席營收官兼總經(jīng)理ArielUtnik說。
  另一個持續(xù)的難題?在人工智能方面,企業(yè)往往會迷失方向。
  “為了新技術(shù)而采用人工智能等閃亮的新技術(shù)可能很誘人,但提出一個有凝聚力的戰(zhàn)略對許多公司來說是一個問題,”Mehta說。“從小處著手,衡量,看看是否能在六個月內(nèi)開始看到影響。”
  展望未來
  大多數(shù)專家預(yù)測人工智能和語音未來會發(fā)生令人興奮的事情。
  “在未來五年內(nèi),每個主要品牌都將擁有一個用于客戶服務(wù)的人工智能語音渠道,就像每個品牌都有一個網(wǎng)站一樣,”Schebella預(yù)測道。“就像在1990年代和2000年代初,當(dāng)組織急于建立在線業(yè)務(wù)時,企業(yè)將有望擁有一個智能的對話界面,以滿足客戶對參與的期望。”
  Mehta看到越來越多的公司轉(zhuǎn)向人工智能來提高客戶旅程的效率。“今天的人們需要真正輕松的支持和互動,雖然這主要通過聊天和消息傳遞,但正如我們所期待的那樣,支持、銷售和營銷方面的免提語音互動將會有巨大的增長,”他說。
  Makhani認(rèn)為,大型類語言模型以及多語言模型將變得更加普遍、易于訪問并與常規(guī)技術(shù)集成。
  “它們將從大型科技公司手中的主要研究用途轉(zhuǎn)向工業(yè)用途。初創(chuàng)公司和去中心化倡導(dǎo)者將積極加速大型模型的廣泛可用性和使用。ASR和NLU將繼續(xù)模糊人類和虛擬化身之間的界限,從而促進(jìn)沉浸式娛樂并加速現(xiàn)實世界的應(yīng)用,例如虛擬世界中的教育和健康診斷。”
  Makhani繼續(xù)說,語音助手將在課堂內(nèi)外的教育中發(fā)揮更大的作用。
  “此外,世界各國政府的隱私法規(guī)將收緊人工智能,包括捕獲和存儲語音,尤其是關(guān)于未成年人的語音,從而加速設(shè)備上ASR、設(shè)備上模型部署和無文本模型的使用,”Makhani補充道。
  Interactions的首席營銷官Jim Freeze對人工智能如何在2021年成為圍繞醫(yī)療創(chuàng)新的對話中不可或缺的一部分感到興奮--他預(yù)計這一運動會滾雪球。
  “隨著大流行的后果越來越使醫(yī)院系統(tǒng)不堪重負(fù),管理人員正在轉(zhuǎn)向?qū)υ捠饺斯ぶ悄茏鳛榻鉀Q方案,”Freeze說。“我預(yù)計這種對話式人工智能在醫(yī)療保健領(lǐng)域的趨勢將持續(xù)到2022年。”
  期望人工智能變得更聰明,更能感知周圍環(huán)境,以檢測當(dāng)?shù)丨h(huán)境。
  “這將具有許多功能--抑制耳機中的噪音、警告我們周圍的事件、在沒有云幫助的情況下在本地執(zhí)行自然語言控制等等。語音AI最終將使用多個傳感器,根據(jù)聲音檢測和處理做出與上下文相關(guān)的復(fù)雜決策,”Knowles的AISonic邊緣處理器高級總監(jiān)Vikram Shrivastava預(yù)測。
  最后,依靠語音在游戲和虛擬世界中傳播。
  “全球估計有32.4億游戲玩家,游戲開發(fā)者可以利用語音技術(shù)在不依賴配音演員的情況下創(chuàng)建更好的角色聲音,并通過使用該技術(shù)增強可訪問性功能,確保各級玩家都能獲得最佳體驗,”Muldoon說。“此外,隨著虛擬世界的新采用,人機交互將變得更加無縫,并模糊現(xiàn)實與虛擬之間的界限。在這個空間中,作為個人,我們可以與我們喜歡的人和物品進(jìn)行動態(tài)交互。在虛擬世界中,人工智能和語音技術(shù)對于確保人們擁有積極的體驗至關(guān)重要。”
  聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
  作者:Erik J.Martin
  原文網(wǎng)址:
  https://www.speechtechmag。com/Articles/Editorial/Features/The-2022-State-of-Artificial-Intelligence-151338.aspx
 
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)