您當(dāng)前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

對(duì)話云有望實(shí)現(xiàn)突破,并帶來大量復(fù)雜性

2022-07-11 08:37:06   作者:   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  CTI論壇(ctiforum.com) (編譯/老秦): 隨著語音服務(wù)變得無處不在,對(duì)它們的依賴帶來了更大的壓力,以提供與人類和非人類的無縫和準(zhǔn)確的通信。例如,在幾年前,誰會(huì)想到對(duì)特定汽車的滿意度可能取決于其語音技術(shù)的質(zhì)量?
  語音技術(shù)已經(jīng)從物理存在(嵌入設(shè)備、本地應(yīng)用程序和聯(lián)絡(luò)中心的交互式語音響應(yīng)等平臺(tái))發(fā)展為云交付,在某些用例中,是部分嵌入和部分云。 Opus Research 創(chuàng)造了"對(duì)話云"一詞來認(rèn)識(shí)到這一現(xiàn)實(shí),同時(shí)指出聯(lián)絡(luò)中心即服務(wù) (CCaaS) 和統(tǒng)一通信即服務(wù) (UCaaS) 等術(shù)語并不能解決多個(gè)聯(lián)絡(luò)中心甚至通信都需要的服務(wù)。 Opus 將對(duì)話云描述為結(jié)合了呼叫處理、語音處理(自動(dòng)語音識(shí)別和文本到語音渲染)、語音和文本分析以及多種認(rèn)知資源的產(chǎn)品。
  正如我在 2020 年 2 月于"語音識(shí)別終于成熟,現(xiàn)在怎么辦?"中指出的那樣,近年來,技術(shù)專家傾向于忽視語音技術(shù),因?yàn)樗鼈兪峭ㄟ^ APIs 交付的,而不是嵌入到應(yīng)用程序中。但他們忽視了 Opus Research 認(rèn)識(shí)到的一點(diǎn),就是人工智能和數(shù)據(jù)注入資源在對(duì)話云中的混合導(dǎo)致了語音能力的飛躍,相比之下,摩爾定律看起來微不足道。
  對(duì)話云不一定限于聯(lián)絡(luò)中心或特定的語音界面;它可以是組織和設(shè)備的混合體。在云之前,語音是在組織內(nèi)的孤島中維護(hù)的。不久前,將經(jīng)過良好調(diào)整的語音識(shí)別器模型復(fù)制到同一組織內(nèi)的不同數(shù)據(jù)中心是一項(xiàng)艱巨的任務(wù),而混合來自不同語音應(yīng)用程序的語音模型是不可能的。借助對(duì)話云,想象一個(gè)醫(yī)療保健組織,其中供應(yīng)商使用聽寫,其管理組織(包括聯(lián)絡(luò)中心和第三方支付公司)受益于醫(yī)療保健程序、藥品名稱、患者姓名等的語音調(diào)整。借助 AI 調(diào)音功能,使用語音界面突然比使用鍵盤更快、更方便。
  使用對(duì)話云,可以創(chuàng)建、調(diào)整和訪問幾乎無限數(shù)量的用例;氐狡,制造商過去常常秘密開發(fā)新產(chǎn)品,并試圖盡可能長(zhǎng)時(shí)間地向競(jìng)爭(zhēng)對(duì)手隱瞞細(xì)節(jié)。但在某個(gè)時(shí)候,那個(gè)"秘密小發(fā)明"變成了一種商品。汽車研究中心經(jīng)常在其對(duì)未來汽車能力的財(cái)務(wù)和人力資源限制方面的預(yù)測(cè)前言。因此,從 2014 年開始,制造商從專有的語音信息娛樂轉(zhuǎn)向 Apple CarPlay,然后是 Android Auto 和 Amazon Alexa,也就不足為奇了。
  語音支持由駕駛員控制的一切的下一步工作正在進(jìn)行中,對(duì)話云正在為其提供動(dòng)力。制造商目前正在為接口的硬件進(jìn)行競(jìng)爭(zhēng),但正如我們?cè)谠S多其他汽車開發(fā)中看到的那樣,它很可能遲早會(huì)成為一種商品。
  您是否認(rèn)為這種對(duì)話云聽起來像是最近的語音技術(shù)進(jìn)步,看起來像魔術(shù)一樣,并且只需跨越很小的技術(shù)障礙即可到達(dá)?
  再想想。
  必須考慮保護(hù)個(gè)人身份信息 (PII)、支付卡行業(yè) (PCI) 信息等,F(xiàn)有法規(guī)(例如 GDPR)暗示需要為不希望錄制音頻的用戶提供選擇退出,但如果組織選擇不允許錄制其輸入以用于調(diào)整目的,那么他們是否應(yīng)該允許客戶使用語音服務(wù)?
  一些對(duì)話式云提供商組織當(dāng)前的工作重點(diǎn)是消除用戶記錄的歧義,足以滿足隱私要求--這意味著合規(guī)性和最終用戶的期望。它還需要有效地清理/屏蔽信息,例如支付卡數(shù)據(jù)和 PII。所有這一切都可能導(dǎo)致成立一個(gè)獨(dú)立的審計(jì)委員會(huì),該委員會(huì)將在消費(fèi)者選擇購(gòu)買或使用哪些產(chǎn)品和服務(wù)時(shí)獲得批準(zhǔn)印章,就像今天的 PCI 合規(guī)性推動(dòng)組織是否可以接受現(xiàn)金以外的付款一樣。
  在語音技術(shù)領(lǐng)域,我們現(xiàn)在的技術(shù)發(fā)展速度太快,人員、流程和法規(guī)都跟不上。一些深入的思考將是必要的,以防止不得不進(jìn)行重大的課程更正。語音技術(shù)確實(shí)進(jìn)入了一個(gè)模糊的階段。
  聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
  作者:Kevin Brown
  原文網(wǎng)址:https://www.speechtechmag.com/Articles/Columns/Inside-Speech/The-Conversational-Cloud-Promises-Breakthroughs-and-Plenty-of-Complexity-153831.aspx
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

相關(guān)閱讀:

專題

CTI論壇會(huì)員企業(yè)