首頁 > 新聞 > 專家觀點 >

智能視頻監(jiān)控技術(shù)架構(gòu)與應用方案特點

2014-06-26 14:16:58   作者:   來源:中關(guān)村在線   評論:0  點擊:


  第1頁:智能視頻監(jiān)控技術(shù)兩種構(gòu)架方式

  視頻監(jiān)控是視頻工程中重要的技術(shù)和應用領(lǐng)域,支撐其發(fā)展的視頻技術(shù)在不到一個世紀的發(fā)展過程中,大致經(jīng)歷了3個跨越式的發(fā)展階段。20世紀30年代,以電視廣播為代表的視頻技術(shù)走出了實驗室,進入廣播電視臺和千萬家庭,實現(xiàn)了從靜止圖像傳輸?shù)交顒訄D像傳輸?shù)目缭剑?0世紀80年代末,以會議電視、視頻監(jiān)控等為代表的視頻技術(shù)走出了實驗室,進入眾多的電視會議室、安防系統(tǒng),實現(xiàn)了從模擬視頻通信到數(shù)字視頻通信的跨越;如今,以智能視頻監(jiān)控(ivs)為代表的視頻技術(shù),正處在走出實驗室、進入到各行各業(yè)的應用階段,將要實現(xiàn)從“機械”的視頻信息處理向智能化視頻信息處理的跨越。當前中國正處在這一跨越的關(guān)鍵時段。智能視頻監(jiān)控只是智能視頻技術(shù)的一個部分,一個將視頻技術(shù)引入智能時代的部分。

  智能視頻監(jiān)控技術(shù)兩種構(gòu)架方式

  視頻監(jiān)控的智能化表現(xiàn)為計算機視覺算法在視頻分析中的應用。智能視頻監(jiān)控區(qū)別于傳統(tǒng)意義上的監(jiān)控系統(tǒng)在于變被動監(jiān)控為主動監(jiān)控(自動檢測、識別潛在入侵者、可疑目標和突發(fā)事件),即它的智能性。簡單而言,不僅用攝像機代替人眼,而且用計算機代替人、協(xié)助人,來完成監(jiān)視或控制的任務(wù),從而減輕人的負擔。智能視頻監(jiān)控系統(tǒng)的結(jié)構(gòu)通常有如下兩種:

  主動智能監(jiān)視系統(tǒng),這類系統(tǒng)的特點是主動攝像機不僅可以理解視場內(nèi)的場景,還可以有選擇性專注于特定的活動或感興趣的事件。主動智能監(jiān)視系統(tǒng)需要額外完成兩個任務(wù):管理主動攝像機資源,即確定哪些攝像機用于監(jiān)視全景,哪些攝像機用于監(jiān)視特定行為或事件;利用視頻分析算法提供的信息控制攝像機的運動和變焦。

  分布式智能視頻監(jiān)視系統(tǒng),通過無線視頻通信網(wǎng)絡(luò)將各點智能攝像機與中心站連接起來,智能監(jiān)視服務(wù)器不僅可以生成圖像還可以分析視頻,根據(jù)視頻分析的信息控制攝像機以及確定使用恰當?shù)拇鎯Y源和帶寬傳送高質(zhì)量視頻給終端用戶。智能攝像機最大程度減小了系統(tǒng)結(jié)構(gòu)的成本。

  智能視頻監(jiān)控技術(shù)特性

  智能視頻監(jiān)控技術(shù)一直在發(fā)展,然而,環(huán)境的復雜性以及目標行為的多樣性等原因使得智能監(jiān)控算法變得復雜,且算法通常是針對具體的應用而設(shè)計的。盡管已經(jīng)提出許多被證明是有效的智能分析算法,但是受計算機數(shù)據(jù)處理能力的限制,難以適合實時計算,自適應性也較差,應用場合受限。目前,對于以目標整體的運動軌跡作為研究目標,提取運動目標的運動特征或者其本身所具有的特性這種類型的視頻智能分析已經(jīng)取得了一定的成果。

  這一類研究目標不一定是人,也可以是車輛、動物或飛機、坦克等軍事目標。以目標的局部部分運動為研究目標,提取其局部的“肢體語言”特征分析判斷目標的行為,比如視頻的手語識別、步態(tài)識別、表情識別或者動作識別等。此類監(jiān)視問題的困難在于運動模式的提取以及高效可靠的識別算法。

  智能視頻監(jiān)控系統(tǒng)可以解決兩個主要問題:一個是將安防操作人員從繁雜而枯燥的“盯屏幕”任務(wù)中解脫出來。由機器來完成這部分工作,對異常情況能夠及時處理等,比如報警等;另外一個是為在海量的視頻數(shù)據(jù)中快速搜索到想要找的圖像。對于上述兩個問題,視頻分析廠家經(jīng)常提到的案例是:操作人員盯著屏幕超過1o分鐘后將漏掉90%的視頻信息而使這項工作失去意義;倫敦地鐵案中,安保人員花了70個工時才在大量磁帶中找到需要的信息。

  智能視頻監(jiān)控的核心內(nèi)容是對特定目標的自動檢測、跟蹤與行為識別,包括運動檢測、目標分類、目標跟蹤、行為識別等4個方面內(nèi)容。例如對人體的跟蹤:首先從實時圖像序列中檢測出運動物體,再判定運動物體中的人體,然后跟蹤人體的運動軌跡,并分析和選定有異常行為的人,如在車站,機場等遺留包裹的人。最后對行為異常的人進行持續(xù)跟蹤。

  移動目標提取

  運動檢測是從圖像序列中將變化區(qū)域從背景圖像中提取出來。運動區(qū)域的有效分割將大大減少后續(xù)過程的運算量。然而,背景圖像的不穩(wěn)定性,如陰影、光照、慢移動、靜移動(樹葉的擺動)等等,也使得運動檢測非常困難。目前較為實用的視頻分析方法主要有兩類:一類是背景減除方法,另一類是時間差分方法。背景減除方法是利用當前圖像和背景圖象的差分來檢測出運動區(qū)域的一種方法,可以提供比較完整的運動目標特征數(shù)據(jù),精確度和靈敏度比較高,具有良好的性能表現(xiàn)。時間差分法利用視頻圖像特征,從連續(xù)得到的視頻流中提取所需要的動態(tài)目標信息。時間差分實質(zhì)是利用相鄰幀圖像相減來提取前景目標移動的信息,此方法不能完全提取所有相關(guān)特征像素點,在運動實體內(nèi)部可能產(chǎn)生空洞,能檢測出目標的邊緣。

  第2頁:移動目標跟蹤

  移動目標跟蹤

  移動目標跟蹤等價于在連續(xù)的圖像幀間,創(chuàng)建基于位置、速度、形狀、紋理、色彩等有關(guān)特征的對應匹配問題。常用的數(shù)學工具有卡爾曼濾波、condensation算法及動態(tài)貝葉斯網(wǎng)絡(luò)等。其中kalman濾波是基于高斯分布的狀態(tài)預測方法。不能有效地處理多峰模式的分布情況;condensation算法是以因子抽樣為基礎(chǔ)的條件密度傳播方法,結(jié)合可學習的動態(tài)模型,可完成魯棒的運動跟蹤。就跟蹤對象而言,跟蹤如手、臉、頭、腿等身體部分與跟蹤整個目標;就跟蹤視角而言,有對應于單攝像機的單一視角、對應于多攝像機的多視角和全方位視角;當然還可以通過跟蹤空間(二維或三維)、跟蹤環(huán)境(室內(nèi)或戶外)、跟蹤人數(shù)(單人、多人、人群)、攝像機狀態(tài)(運動或固定)等方面進行分類。從跟蹤方法的不同討論跟蹤算法。

  (1)基于模型的跟蹤

  傳統(tǒng)的人體表達方法有如下三種:①線圖法:人運動的實質(zhì)是骨骼的運動,因此該表達方法將身體的各個部分以直線來近似。②二維輪廓(2d contour):該人體表達方法的使用直接與人體在圖像中的投影有關(guān),如ju等提出的紙板人模型,它將人的肢體用一組連接的平面區(qū)域塊所表達,該區(qū)域塊的參數(shù)化運動受關(guān)節(jié)運動(articulated movement)的約束,該模型被用于關(guān)節(jié)運動圖像的分析。③立體模型(volumetric model):它是利用廣義錐臺、橢圓柱、球等三維模型來描述人體的結(jié)構(gòu)細節(jié),因此要求更多的計算參數(shù)和匹配過程中更大的計算量。

  例如rohr使用14個橢圓柱體模型來表達人體結(jié)構(gòu),坐標系統(tǒng)的原點被定位在軀干的中心,目的是想利用該模型來產(chǎn)生人的行走的三維描述;wachter與nagel利用橢圓錐臺建立三維人體模型,通過在連續(xù)的圖像幀問匹配三維人體模型的投影來獲得人運動的定量描述,其中,它利用了迭代的擴展卡爾曼濾波方法,結(jié)合邊緣、區(qū)域信息及身體解析約束確定的身體關(guān)節(jié)運動的自由度,實現(xiàn)單目圖像序列中人的跟蹤。

分享到: 收藏

專題