正在播放国产Av国模私拍,欧美性色生活片天天看99,国产乱叫456在线

　　在第二屆聲紋識(shí)別產(chǎn)業(yè)發(fā)展與創(chuàng)新研討會(huì)上，中國(guó)科學(xué)院院士、清華大學(xué)人工智能研究院院長(zhǎng)張鈸首次談到第三代人工智能與聲紋識(shí)別產(chǎn)業(yè)，本文為張鈸院士發(fā)言內(nèi)容總結(jié)，全文約2900字。

　　我們?yōu)槭裁刺岢龅谌斯ぶ悄埽?/strong>

　　它與聲紋識(shí)別產(chǎn)業(yè)有什么關(guān)系？

　　人工智能這60年間一共做了兩件事。

　　一是發(fā)展第一代人工智能，就是大家比較熟悉的符號(hào)模型，也叫知識(shí)驅(qū)動(dòng)。

　　基本思路是：智能來(lái)自何處？來(lái)自知識(shí)，知識(shí)是人類智能的源泉。這是最早建立人工智能的時(shí)候所建立的基本思想。這個(gè)思想對(duì)聲音的處理，就是對(duì)語(yǔ)音識(shí)別，包括聲紋都有一些影響。

　　第一代人工智能時(shí)期

　　大概在70、80年代基本上統(tǒng)治了人工智能，所以人工智能對(duì)各個(gè)領(lǐng)域都有影響。對(duì)聲音處理的主要影響是大家試圖通過發(fā)聲和聽覺的機(jī)理來(lái)建立計(jì)算模型。早期做過很多努力，但是并沒有成功。主要原因是我們對(duì)人類聽覺機(jī)理了解的很少，這也是人工智能遇到的最大困難。我們對(duì)智能是什么到現(xiàn)在為止還沒有一個(gè)公認(rèn)的科學(xué)定義，但是我們要在這種情況下去搞人工智能，怎么搞？這就出現(xiàn)一個(gè)很大的問題。

　　當(dāng)初大家覺得可以搞人工智能，就認(rèn)為人類的智能來(lái)自于知識(shí)，知識(shí)在很多情況下可以用自然語(yǔ)言表達(dá)出來(lái)。根據(jù)這個(gè)思路，對(duì)比如醫(yī)療診斷或者其他的領(lǐng)域都做了一些所謂以知識(shí)為基礎(chǔ)的推理系統(tǒng)，這就是大家非常熟悉的專家系統(tǒng)。它的基本思路就是認(rèn)為人類的知識(shí)可以用自然語(yǔ)言表達(dá)出來(lái)，因此我們可以把這些知識(shí)表達(dá)在計(jì)算機(jī)里頭，計(jì)算機(jī)對(duì)知識(shí)進(jìn)行加工，這是第一代人工智能。

　　第一代人工智能到到90年代以前不是特別成功，90年代以后人工智能有了很多新的發(fā)展，給知識(shí)驅(qū)動(dòng)的方法也帶來(lái)新的活力。

　　第二個(gè)就是現(xiàn)在大家非常熟悉的連接主義或者深度學(xué)習(xí)。

　　第二代人工智能時(shí)期

　　講的簡(jiǎn)單一點(diǎn)就是基于大數(shù)據(jù)的深度學(xué)習(xí)。90年代后，第一代人工智能進(jìn)入低潮開始衰退，正好第二代人工智能引起了高潮。

　　深度學(xué)習(xí)為什么現(xiàn)在這么受歡迎，一個(gè)非常重要的原因是，原來(lái)輸進(jìn)去的語(yǔ)音和圖像必須人工抽取特征，然后把這些特征輸?shù)缴窠?jīng)網(wǎng)絡(luò)去，對(duì)它進(jìn)行分類。有了深度學(xué)習(xí)以后有了很大改變，只需要輸入原始的信息就可以了。聲音基本上可以用原始的波形輸進(jìn)去，圖像可以輸入原始的像素組成的點(diǎn)陣，由網(wǎng)絡(luò)自動(dòng)抽取特征。這樣一來(lái)就使得深度學(xué)習(xí)變成了一個(gè)大眾化的工具，不要求你有專業(yè)領(lǐng)域的知識(shí)，誰(shuí)都可以用。

　　過去搞人臉識(shí)別必須知道抽取臉部哪部分的特征最有效�，F(xiàn)在你只要把組成人臉的像素輸進(jìn)去就可以。換句話講，以前搞人臉識(shí)別，大部分時(shí)間要花去研究特征的提取，現(xiàn)在有了深度學(xué)習(xí)，這一部分的工作完全不需要了，這也給語(yǔ)音識(shí)別帶來(lái)很大的影響。

　　語(yǔ)音識(shí)別在2011年以前，基本上正確率是80%，誤識(shí)率20%，幾乎不能用。到2015年的時(shí)候超過95%，到了2017年的時(shí)候，所有商業(yè)應(yīng)用的語(yǔ)音識(shí)別系統(tǒng)全是用深度學(xué)習(xí)，包括亞馬遜、微軟、我們國(guó)家的百度、訊飛，都是用同一原理-深度學(xué)習(xí)。所以大家做到的水平基本上都差不多，在95%以上。

　　那么我們?cè)倏匆幌碌谝欢斯ぶ悄艿木窒扌�。這些局限性對(duì)產(chǎn)業(yè)的發(fā)展影響非常大，首先應(yīng)用場(chǎng)景就有很大的局限，應(yīng)用場(chǎng)景必須要滿足一下這5個(gè)條件：

　　必須具有豐富的知識(shí)或者大量的數(shù)據(jù)。如果這兩個(gè)都沒有，就做不了人工智能。第一代人工智能認(rèn)為智能的資源是來(lái)自知識(shí)，這是人工智能創(chuàng)建人一致的認(rèn)識(shí)。深度學(xué)習(xí)的發(fā)展，大家又認(rèn)識(shí)到到數(shù)據(jù)對(duì)人工智能的重要性。人工處理數(shù)據(jù)的能力遠(yuǎn)不如計(jì)算機(jī)，相反，計(jì)算機(jī)處理數(shù)據(jù)的能力則遠(yuǎn)超過人類，這也是深度學(xué)習(xí)成功的原因所在。

　　如果符合豐富的知識(shí)或經(jīng)驗(yàn)、完全信息、確定性、靜態(tài)、單領(lǐng)域和單任務(wù)這5個(gè)條件，人工智能完全可以做到超過人類。即使問題非常復(fù)雜，比如圍棋，但它完全符合這5個(gè)條件，所以計(jì)算機(jī)戰(zhàn)勝人類理所當(dāng)然。只要符合這5個(gè)條件，就算今天超不過，明天計(jì)算機(jī)肯定會(huì)超過。

　　這5個(gè)條件的限制是非常嚴(yán)格的，很多問題不滿足這些條件。

　　對(duì)語(yǔ)音識(shí)別來(lái)講，如果有噪聲，就不滿足“確定性”這一條件。所以在有噪聲的情況下，語(yǔ)音識(shí)別的性能就會(huì)降低非常多。

　　最后一個(gè)非常重要的問題是人工智能安全。

　　目前的人工智能技術(shù)，特別是基于大數(shù)據(jù)的深度學(xué)習(xí)算法具有4個(gè)不：不安全、不可信、不可靠，不易推廣。

　　安全問題對(duì)語(yǔ)音區(qū)別也有很大的影響。剛才說(shuō)過，深度學(xué)習(xí)給語(yǔ)音識(shí)別帶來(lái)非常大的好處，它的識(shí)別率原來(lái)幾乎不能用，到現(xiàn)在完全可以商用。但語(yǔ)音識(shí)別技術(shù)也非常脆弱和非常不安全。

　　下面的例子用來(lái)說(shuō)明語(yǔ)音識(shí)別的脆弱性。

　　英文（語(yǔ)音）原話是這樣：“沒有數(shù)據(jù)集這篇文章是沒用的”，如果在這句話加上一點(diǎn)點(diǎn)噪聲，人聽起來(lái)完全一樣沒有變。計(jì)算機(jī)聽起來(lái)卻變成完全不同的話——“好的，谷歌瀏覽evil。com”。

　　換句話講，非常不安全，非常容易受攻擊，這就非常危險(xiǎn)。

　　為什么現(xiàn)在聲紋識(shí)別比較魯棒？這個(gè)問題我是從鄭方老師那里受到啟發(fā)。聲紋現(xiàn)在沒有完全使用基于大數(shù)據(jù)的深度學(xué)習(xí)方法，據(jù)鄭老師講使用深度學(xué)習(xí)效果并不太好。

　　為什么聲紋識(shí)別到現(xiàn)在為止還沒有找到一個(gè)非常有效的攻擊手段？原因之一可能在這里，就是運(yùn)用了多種的預(yù)處理方法，“預(yù)處理”實(shí)際上體現(xiàn)了某種知識(shí)的運(yùn)用。所以目前來(lái)講我認(rèn)為聲紋識(shí)別帶有第三代人工智能的一些特點(diǎn)，所以它相對(duì)來(lái)講比較魯棒。

　　我們提倡第三代人工智能。

　　第三代人工智能一共是三句話：

　　1.構(gòu)建可解釋和魯棒的人工智能理論和方法。

　　2.發(fā)展安全、可信、可靠和可擴(kuò)展的人工智能技術(shù)。（就是把目前人工智能四個(gè)缺陷的“不”去掉）

　　3.推動(dòng)AI的創(chuàng)新應(yīng)用。

　　我們要解決AI的產(chǎn)業(yè)問題，必須解決前面講的兩個(gè)問題，不解決的話AI的產(chǎn)業(yè)的是很難做大做強(qiáng)。解決問題的思路也比較簡(jiǎn)單，即把知識(shí)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)結(jié)合起來(lái)。結(jié)合起來(lái)的效果是什么？即充分利用了以下4個(gè)要素：知識(shí)、數(shù)據(jù)、算法和算力。

　　第一代人工智能使用了知識(shí)、算法和算力，當(dāng)時(shí)算力很差，所以第一代人工智能不是很成功。第二代人工智能，我們把重點(diǎn)瞄準(zhǔn)后面三個(gè)要素，數(shù)據(jù)、算法和算力。第二代人工智能之所以比較成功，由于這三個(gè)要素都很給力。

　　充分利用四個(gè)要素說(shuō)起來(lái)容易做起來(lái)卻非常難，因?yàn)橹R(shí)和數(shù)據(jù)表現(xiàn)形式完全不一樣。另外，知識(shí)很難獲取，我們剛才說(shuō)做人工智能的困難在哪？智能本身都沒搞清楚怎么去做人工智能？當(dāng)前多數(shù)人走的是：Brain inspired computing（腦啟發(fā)下計(jì)算）的道路，有的把它翻譯成“類腦計(jì)算”，讓大家以為是個(gè)全新的東西。

　　大家都很關(guān)注人工智能的產(chǎn)業(yè)化，我這里列出的人工智能獨(dú)角獸企業(yè)（來(lái)自胡潤(rùn)統(tǒng)計(jì)），全世界共40家，其中美國(guó)占20家，中國(guó)占15家，我國(guó)穩(wěn)居老二地位。其他英國(guó)、日本、以色列等國(guó)家相對(duì)都很少。但無(wú)論是國(guó)內(nèi)還是國(guó)際企業(yè)都面臨進(jìn)一步做大做強(qiáng)的挑戰(zhàn)。

　　如何把聲紋產(chǎn)業(yè)做大做強(qiáng)？我認(rèn)為主要是要尋找新的應(yīng)用場(chǎng)景。我們團(tuán)隊(duì)現(xiàn)在正在把語(yǔ)音識(shí)別或聲紋識(shí)別技術(shù)應(yīng)用到呼吸系統(tǒng)的診斷上，取得很好的效果，也可以考慮把聲音識(shí)別的技術(shù)用到診斷機(jī)械故障等等。

　　清華大學(xué)人工智能研究院目前已經(jīng)成立了9個(gè)中心，其中兩個(gè)偏重于基礎(chǔ)研究，一個(gè)是從機(jī)器學(xué)習(xí)的角度，一個(gè)是從知識(shí)處理的角度。我認(rèn)為，知識(shí)和數(shù)據(jù)是驅(qū)動(dòng)人工智能往前發(fā)展的兩個(gè)輪子。