您當(dāng)前的位置是:  首頁 > 資訊 > 國際 >
 首頁 > 資訊 > 國際 >

為啥要保護(hù)你的聲音資產(chǎn)? AI正從中挖掘更多秘密

2019-08-20 16:11:38   作者:   來源: 中國軟件網(wǎng)   評論:0  點(diǎn)擊:


  給我們一個人的聲音,我們會告訴你他聲音背后的很多密碼:健康情況、精神狀態(tài)、金融實(shí)力、個人性格······用人工智能技術(shù),你的聲音可以透露出更多的秘密。
  以色列公司Voicesense向客戶提供了一個有趣的承諾:給我們一個人的聲音,我們會告訴你他聲音背后的很多秘密。這家公司在個人通話期間使用實(shí)時語音分析技術(shù),可以評估其銀行貸款是否可能違約,能否購買更昂貴的產(chǎn)品,或者成為最佳的工作伴侶。
  據(jù)外媒報道,聲音數(shù)據(jù)非常個人化,很難偽造,并且包含了有關(guān)人類心理健康和行為的令人驚訝的信息。
  有不少公司和研究人員,正在利用人的語音數(shù)據(jù),得到人的更多的信息,用于健康監(jiān)測、精神狀態(tài)分析、金融服務(wù)推銷、客戶服務(wù)等。人們不得不驚嘆語音帶給人們工作、生活帶來的便利,同時語音技術(shù)有可能正在一些方面侵害個人隱私,影響大家享受公正公平社會服務(wù)。
  一、正在大量被收集的個人聲音數(shù)據(jù)
  “現(xiàn)在有大量的設(shè)備可以捕捉個人的語音,無論是你的手機(jī),還是像Alexa和Google Home這樣的東西。”,麻省理工學(xué)院麥戈文腦研究中心的研究科學(xué)家Satrajit Ghosh說,F(xiàn)在有很多的公司和機(jī)構(gòu)有興趣為心理健康目的開發(fā)語音分析,聲音在生活中變得無處不在。
  根據(jù)商業(yè)分析公司IdTechEx的報告,語音技術(shù)市場正在迅速增長,預(yù)計到2029年將達(dá)到155億美元。
  近年來,研究人員和初創(chuàng)公司已經(jīng)注意到可以從語音中挖掘出豐富的信息,尤其是像亞馬遜的Alexa這樣的家庭助理的普及,人們在家中與Alexa交談,數(shù)字語音助理越來越多地用于醫(yī)院,使得消費(fèi)者越來越習(xí)慣于與這些設(shè)備交談。
  Alexa是一款完全基于語音指令驅(qū)動,無需屏幕的AI語音助理軟件,于2015年8月正式向第三方開放。此前,Alexa一直默默無聞地充當(dāng)著亞馬遜另一款產(chǎn)品——智能語音音箱Echo的幕后功臣,為其創(chuàng)造了上市兩年累計銷量超過550萬臺的成績。
  根據(jù)數(shù)據(jù)統(tǒng)計,搭載Alexa的硬件品類已經(jīng)超過7000種。產(chǎn)品品類從電器、手機(jī)到機(jī)器人、汽車信息娛樂系統(tǒng),品牌涵蓋了LG、華為、GE、福特、大眾、聯(lián)想、優(yōu)必選等多個領(lǐng)域。半年的時間內(nèi),亞馬遜讓Alexa平臺的接入數(shù)量增長了6000家。分析師Mark Mahaney預(yù)計,在最近的假日季亞馬遜賣出了1000萬臺Alexa設(shè)備。
  谷歌的智能家居產(chǎn)品——Google Home,注重于音樂娛樂和語音搜索的硬件產(chǎn)品。它內(nèi)置了處理系統(tǒng)以及谷歌助理,相比蘋果的Siri和微軟Cortana,Google Home不僅僅進(jìn)行語音交互,并透過機(jī)器學(xué)習(xí)與人工智能的結(jié)合,使其轉(zhuǎn)變成為為智能家居控制中心,或者也可以稱之為智能管家。
  二、如何從聲音數(shù)據(jù)探究信息?
  聲音不僅無處不在;它非常個人化,很難假裝,并且出現(xiàn)在我們最私密的環(huán)境中。
  據(jù)國外媒體報道,語音分析研究的關(guān)鍵是個人如何說:音調(diào)、速度、重點(diǎn)和停頓等,核心是機(jī)器學(xué)習(xí)。技術(shù)人員從兩組中挑選標(biāo)記樣本,例如,焦慮的人與沒有的人,并將數(shù)據(jù)提供給算法。然后,該算法學(xué)會獲取可能表明某人是否屬于A組或B組的微妙說話符號,并且可以在將來對新樣本執(zhí)行相同操作。
  卡耐基梅隆大學(xué)(CMU)計算機(jī)科學(xué)家Louis-Philippe Morency表示,分析結(jié)果有時可能違反直覺。他建立了一個名為SimSensei的項(xiàng)目,可以幫助人們用語音檢測抑郁癥。在一些試圖將聲音特征與再次嘗試自殺的可能性相匹配的早期研究中,Morency的研究小組發(fā)現(xiàn),聲音柔和、氣喘的人,而不是那些有緊張或憤怒聲音的人,更有可能再次嘗試自殺。然而,這項(xiàng)研究是初步的。
  盡管如此,研究人員已經(jīng)建立了使用聲音來幫助識別從帕金森病到創(chuàng)傷后應(yīng)激障礙的所有算法。對于許多人來說,這項(xiàng)技術(shù)的最大承諾在于語音分析和心理健康的交叉,并希望創(chuàng)建一種簡單的方法來監(jiān)控和幫助那些有復(fù)發(fā)風(fēng)險的人。
  Companion Mx是一種精神健康監(jiān)測系統(tǒng),目前僅適用于醫(yī)生和患者。患者使用該應(yīng)用程序記錄音頻日記。該程序分析這些日記以及呼叫日志和位置等元數(shù)據(jù),以確定患者狀況,通過評價四個因素——抑郁情緒、興趣減少、躲避和疲勞,與患者共享,并在儀表板中提供給希望密切關(guān)注患者行為的醫(yī)生。該公司已經(jīng)對該產(chǎn)品進(jìn)行了7年的測試,并且有超過1500名患者。結(jié)果表明,該技術(shù)可以預(yù)測抑郁癥和創(chuàng)傷后應(yīng)激障礙的癥狀,但需要進(jìn)一步驗(yàn)證。
  同時,Voicesense、CallMiner、RankMiner等服務(wù)和Companion Mx的母公司Cogito承諾在業(yè)務(wù)環(huán)境中使用語音分析。大多數(shù)時候,這意味著改善呼叫中心的客戶服務(wù)參與度。Voicesense有更大的夢想:貸款違約預(yù)測,保險索賠預(yù)測,揭示客戶的投資風(fēng)格,人力資源的內(nèi)部候選人評估,評估員工是否可能離開等,并可以提供關(guān)于健康行為、工作行為、娛樂等的預(yù)測。
  Voicesense語音處理算法每秒測量200多個參數(shù),并且可以在許多不同的語言上準(zhǔn)確實(shí)現(xiàn),包括像中國的普通話這樣的語言。該計劃仍處于試點(diǎn)階段,但該公司與大型銀行以及其他投資者保持聯(lián)系。“每個人都對這種技術(shù)的潛力著迷。”
  三、你的聲音也是一種數(shù)字資產(chǎn)
  到目前為止,但很少有人考慮到,我們的聲音作為另一種形式的數(shù)據(jù),可以告訴我們自己和別人很多信息。所有這些都導(dǎo)致了關(guān)于這些信息如何被利用,以及如何使用和保護(hù)個人隱私的問題。
  德雷塞爾大學(xué)(Drexel University)的犯罪學(xué)教授Robert D'Ovidio擔(dān)心,Voicesense設(shè)想的一些應(yīng)用可能具有歧視性。想象一下,他打電話給一家抵押貸款公司,并且他們用你的聲音來確定你患心臟病的風(fēng)險更高,然后你被認(rèn)為風(fēng)險更高。“我真的認(rèn)為,制定消費(fèi)者保護(hù)立法,以防止收集這些。”
  華盛頓大學(xué)法學(xué)院教授瑞安·卡洛指出,存在這樣的一些消費(fèi)者保護(hù)措施。語音被認(rèn)為是一種生物識別措施,而美國的一些州已經(jīng)制定了保證生物識別安全的法律。與種族或性別等敏感類別信息相關(guān)的偏見問題是機(jī)器學(xué)習(xí)技術(shù)的特有問題,無論這些技術(shù)是用于語音分析還是查看簡歷,當(dāng)這些機(jī)器學(xué)習(xí)方法用于面部或語音識別時,人們會感到內(nèi)心不安,部分原因是這些特征是如此個性化。雖然存在反歧視法律,但圍繞語音分析的問題涉及更廣泛,即何時可以使用信息以及什么構(gòu)成歧視,這是我們作為一個社會沒有充分努力解決的概念。
  很多專家認(rèn)為,未來發(fā)展中,數(shù)據(jù),無論采用何種形式,都是一種資產(chǎn);在數(shù)據(jù)采集應(yīng)用中,針對大批量數(shù)量應(yīng)用,數(shù)據(jù)就像在電子表格或聲紋中輸入的一堆數(shù)字一樣,沒有特殊的含義,即脫敏;在針對個人時,隱私應(yīng)該得到保護(hù),至少,在使用個人數(shù)據(jù)時應(yīng)該即時得到通知。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點(diǎn)判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)