思科堪稱業(yè)界人工智能的先驅,在很早之前就開始進行相關研究,并逐步將其運用到每一代協(xié)作產品中。因此思科有很多領先友商的 AI 技術,甚至是獨有的功能如 “超聲波移動檢測” 和 “噪聲檢測” 等。
本文就將圍繞這些領先的技術,為您介紹 AI 在思科協(xié)作終端設備上的應用和其為人們帶來的全新協(xié)作體驗。
1、語音撥號:邊聽邊學的超級學霸
簡而言之就是將傳統(tǒng)通過觸屏、遙控器等控制的物理操作簡化成語音控制。但區(qū)別于通過固定指令的語音識別,且是出廠時已設置好的封閉系統(tǒng)的實現(xiàn)方式,思科語音撥號通過聯(lián)接思科的協(xié)作云,實現(xiàn)真正的人機交互,即隨著辨識越來越多人的聲音包括不同地域、聲線、音量等,并在日積月累中不斷地學習,系統(tǒng)會變得越來越“聰明”,語音識別的正確度、復雜度都會逐漸提高。
2、人臉識別:hold住全局的會議專家
- 發(fā)言者跟蹤:會議中誰發(fā)言攝像頭就會聚焦誰,思科不是第一個推出該功能,但是在真實會議場景中,思科的產品是體驗最好的。
在真實的會議場景中,與會人員的位置、動態(tài)、高度等會出現(xiàn)各種隨機的變化,很難真實捕捉,設想當出現(xiàn)當兩人對話時鏡頭頻繁切換的囧況,或只聚焦一人而完全忽略另一人的狀態(tài),這樣的結果會怎么能讓客戶滿意?但思科的協(xié)作產品憑借出色的 AI 表現(xiàn),無論會議現(xiàn)場多么復雜都能從容地 hold 住全局。
- 實時捕捉:結合與會者所有人的信息,實時捕捉每一個發(fā)言人的面部,發(fā)言者的位置、聲量、高度都會充分捕捉。
- 最佳取景:能自動調整鏡頭的各個方向、自動對焦,而在過去人們需要一個專門的管理人員在會議過程中不斷觀察會議變動情況,通過遙控器來頻繁調整,不僅效率低且會影響與會人員的會議體驗。
- 面部識別:這是思科的又一創(chuàng)新功能,結合語音定位、語音跟蹤,自動識別、跟蹤人臉進行面部識別和動態(tài)捕捉,并進行拍攝,跟后臺數(shù)據(jù)庫比對后會在會議界面顯示每位發(fā)言者的名字及職位等信息,而且是動態(tài)比對,省去了每個人的自我介紹等環(huán)節(jié)。
而在過去,這些都需要秘書人員手動操作,隨著會議規(guī)模擴大或不斷有新成員的加入,人工操作非常低效。
- 會議人數(shù)統(tǒng)計:通過識別后將人臉和后臺數(shù)據(jù)庫進行比對后進行精準統(tǒng)計。
3、智能降噪:心無旁騖的專注大師
首先智能感知到雜音,例如敲擊鍵盤的聲音、說話聲音等,然后進行自動抑制,即通過麥克風收音然后識別,收集發(fā)言者聲音的同時,不斷壓低其它雜音。
設備監(jiān)測到雜音后(如敲擊鍵盤、翻動書本等)會進行學習,不斷地記錄、學習、積累,識別率會越來越高,甚至能分辨出不同人敲擊鍵盤的聲音,進而將會議過程中的雜音降到最低,從而能夠讓與會人員都能更加投入地進行會議。
4、智慧平臺:強強結合的 AI 平臺
思科協(xié)作終端設備整合了業(yè)界先進的 NVIDIA Jetson 人工智能計算平臺,從而能讓思科終端設備的性能得到更好地發(fā)揮,為你帶來更智能的終端協(xié)作體驗。
怎么樣,了解了這些神奇的 AI 協(xié)作功能之后,相信你也會對開會這件事有了全新的認識,或許有人會問,如果不在會議室離開了思科的這些終端設備呢?除了以上基于思科終端的會議形式外,不在會議室時,Webex meeting 的人物洞察依然能為您帶來智能化的會議體驗!還等什么?趕快去開個會吧!