首頁>>>技術(shù)>>>視像通信  視像通信產(chǎn)品

云計算讓視頻識別成為現(xiàn)實

2010/08/25

  北京時間8月24日消息,三網(wǎng)融合中國峰會在北京召開。天脈聚源(北京)傳媒科技有限公司執(zhí)行總裁尹遜鈺參加了本次論壇并發(fā)表主題演講。

  尹遜鈺:謝謝各位,我今天演講的題目大家看一下叫“視頻中國,共贏云端”,今天聽了很多專家的講解,今天的收獲也很大。在視頻領(lǐng)域,尤其在三網(wǎng)融合的視頻領(lǐng)域,哪些部分可以由云計算完成的?

  過去我們了解了云計算的方向發(fā)展,包括科技,大家往往覺得云計算離我們很遠(yuǎn),包括無錫有IBM的云計算中心,曙光6000等大型計算機(jī)都在做云計算。現(xiàn)實生活中有沒有根據(jù)我們視頻行業(yè)有關(guān)的云計算案例,今天我們就把這塊與大家分享一下。

  在座各位都是廣電領(lǐng)域的專家,包括網(wǎng)絡(luò)公司、電視臺、企業(yè)和廠商的,我們要做三網(wǎng)融合的平臺,除了網(wǎng)絡(luò)之外還有三部分,一是內(nèi)容,二是平臺,三是產(chǎn)品。這是怎么也繞不開的,你必須得有大量的內(nèi)容,有好的傳輸平臺和好的運(yùn)營平成、支撐平臺才能夠構(gòu)架出業(yè)務(wù)體系,最終得有好的產(chǎn)品化包裝,才能讓用戶買單,才能有人群來使用,才能產(chǎn)生商業(yè)價值。今天我會重點針對內(nèi)容角度,平臺和產(chǎn)品更多是由廣電運(yùn)營商來建設(shè),而內(nèi)容建設(shè),我們認(rèn)為會有新的解決方案提供這樣的服務(wù),來把海量的內(nèi)容經(jīng)過云端處理,把內(nèi)容發(fā)送給不同的合作伙伴之中。

  很多人講廣電是以內(nèi)容為王,的確也是這樣,因為有內(nèi)容的牌照,我們才能在三網(wǎng)融合掌握先機(jī),掌握市場準(zhǔn)入的機(jī)會,達(dá)到目前的狀況。同時,這些海量到底有多大的利用率?據(jù)我了解,電視臺或者電視網(wǎng)絡(luò)公司都有大量的內(nèi)容,但都是以傳統(tǒng)的方式存在,包括帶庫生產(chǎn)效率和新媒體化是很低的。有一個統(tǒng)計,目前只能利用到7%,還有90%多的內(nèi)容沒有被利用到。為什么呢?這塊內(nèi)容缺乏有效和高效的生產(chǎn)和處理手段來迅速轉(zhuǎn)變成基于互聯(lián)網(wǎng)上的,基于手機(jī)上的,基于IPTV的快速的面向用戶的產(chǎn)品,網(wǎng)絡(luò)是一個快速消費(fèi)品,和電視還是有點不同的,電視的播出是由編導(dǎo)、導(dǎo)演的思路決定,我們電視每天要做的事情并不復(fù)雜,是一兩個編導(dǎo)決定下來要過什么東西,從庫里調(diào)出來,或者到外面拍攝,選擇素材就可以了,但物聯(lián)網(wǎng)不是,內(nèi)容選擇權(quán)要交給用戶,而不是自己,當(dāng)你有這種選擇權(quán)的時候,就會發(fā)現(xiàn)這種選擇權(quán)變得非常重要,這該需要龐大的資源體系。

  當(dāng)前電視臺和網(wǎng)絡(luò)電視臺在做新媒體的時候更多采用傳統(tǒng)公司非編的方式來做,昨天晚上下班之前我在車?yán)锟吹较,就是菲律賓劫持人質(zhì),7點半到8點之間,當(dāng)時也播放了現(xiàn)場畫面,說剛剛有15個人被殺死了,當(dāng)時我非常愿意見證這個市場。我就在停車的時候用我的iPad打開了,當(dāng)時通過iPad通過鳳凰咨詢臺全程直播,打開的時候確實出現(xiàn)了窗口出現(xiàn)了六個彈孔,說明剛剛發(fā)生槍戰(zhàn)的過程。當(dāng)突發(fā)事件出現(xiàn)的時候,能不能借助好的新媒體終端快速看到這些內(nèi)容,這就是網(wǎng)絡(luò)所帶給我們的轉(zhuǎn)變,以往電視播出很簡單,你要守在電視前,現(xiàn)在不是這樣。

  今天早上遇到紅燈我同事在做另外的事情,到底有多少人傷亡,因為昨天晚上沒有明確答案,我搜索到全國電視臺關(guān)于境外的頻道最新報道菲律賓劫持人質(zhì)的事情。我這里有剛剛?cè)c鐘的報道,所以,互聯(lián)網(wǎng)的內(nèi)容很多是來自于傳統(tǒng)的,但傳統(tǒng)的內(nèi)容需要高效的方法變成互聯(lián)網(wǎng)化、顆;,信息的播出是連續(xù)的內(nèi)容,而不是針對現(xiàn)在越來越完善,越來越簡單精致的新終端的模式。

  如果在座各位下面有專門做產(chǎn)品和運(yùn)營的朋友可能會有這樣的想法,大家會有一個夢想,我們會有一個訴求,能不能在我們每天晚上睡覺的時候,來自于電視臺上大量的內(nèi)容就能夠自動地被收錄或截取成有效的,適合于互聯(lián)網(wǎng)或者新媒體播出的資源,每天電視頻道播了這么多東西,我們把數(shù)字化好,把有用的信息提取出來,這要快,要準(zhǔn),要省錢、省力。因為內(nèi)容處理本身是一個體力活,沒有太多的技術(shù)含量,就是一個數(shù)字化的過程。但數(shù)字化過程本身并不意味著簡單地把內(nèi)容錄制下來或者把內(nèi)容做一個直播,這個意義是不大的,更多的是要把你有價值信息里的核心內(nèi)容整理出來,建立好有效的標(biāo)簽、標(biāo)準(zhǔn)的機(jī)制。

  我們同時還在想,電視內(nèi)容是一方面,還需要把現(xiàn)有媒資和第三方合作伙伴的資源和用戶上載的資源變成我強(qiáng)大的資源平臺而一致面向我各種各樣的終端:電腦、手機(jī)或互聯(lián)網(wǎng)、電視來進(jìn)行發(fā)布。我想大家都有這樣的想法。

  歸結(jié)下來,從實際的問題來講,除了我們在播控平臺的流程、政策方面的理解以外,實際開展這項業(yè)務(wù)的時候,的確會有這幾個任務(wù)出現(xiàn),我列出了幾個問題,一是信源的要求,電視、媒資庫、第三方內(nèi)容、UGC。二是編碼質(zhì)量,高清收錄,高清編碼,采用H.264協(xié)議。三是處理能力,我們必須把自己從煤老板變成“媒老板”。四是處理效率,能不能做到電視發(fā)生了以后,我十分鐘就可以檢索到這個事件,通過各種通道看到它,這是用戶的最終使用行為,為什么用戶不用電視、IPTV一定要用電腦來看,一定是傳統(tǒng)媒體無法滿足的,就是時效性。四是碎片化,把一個個內(nèi)容變成非常精準(zhǔn)的內(nèi)容。五是模式識別,盡量提取電視語音的特征幫你構(gòu)成索引。六是做好新的媒體標(biāo)引的屬性。網(wǎng)絡(luò)電視都有一些媒資,傳統(tǒng)媒資側(cè)重編導(dǎo)、節(jié)目制作角度去做,比如場景、角度,而新媒體的媒資面向應(yīng)用的,傳統(tǒng)媒資好比圖書館,面向?qū)<液蛯W(xué)者服務(wù)的,新媒資像亞馬遜,像賣書的,資料賣給1萬多人的,需要新的標(biāo)引重新建立,以往的媒資不能滿足快速網(wǎng)絡(luò)化消費(fèi)。七是內(nèi)容支持,iPad既不是手機(jī),也不是電腦,但可以3G上網(wǎng),我們很多政策對手機(jī)的約定對它是無效的,這些東西都是我們要考慮的。八是業(yè)務(wù)支持,就是要考慮基于視頻的業(yè)務(wù),直播、輪播、回看和搜索。八是產(chǎn)品能力,就是信息整合,信息關(guān)聯(lián)和信息挖掘,這是根據(jù)你的平臺和廣告做出的具體的數(shù)據(jù)體系。

  這是我搜索到的菲律賓人質(zhì)的劫持事件,這是天脈在無錫建立的云計算收錄平臺,給各大有線電視臺提供電視臺收錄、碎片化的處理,現(xiàn)在大概有200人、500個服務(wù)器,600T存儲,每天進(jìn)行生產(chǎn),而且是源源不斷的。這是下午14:02馬尼拉事件的報道,這是CNN的。當(dāng)前我們采用云計算的模式到底能做什么,為什么要這么做?中午12:20的新聞,北京電視臺播出的。這是一段電視節(jié)目,是標(biāo)清的質(zhì)量,應(yīng)該是在1.3M H.264的編碼。我們在云計算的時候是把一個完整電視新聞或者新聞內(nèi)容碎片化,把廣告剔除,只剔除出內(nèi)部的文本,F(xiàn)在天脈已經(jīng)把語音識別、文字識別處理程度達(dá)到95%以上是自動化完成的,有了語音識別的模式以后,對我來講,我在對視頻的理解,就可以把它當(dāng)成文字一樣,我在搜索任何一個視頻的時候,在搜索文本的時候就找到視頻的內(nèi)容,這個文字就是播音員的話,視頻的內(nèi)容反復(fù)在文字旁邊反復(fù)播控。這是高碼流、中碼流,手機(jī)、IPTV、互聯(lián)網(wǎng)全部特征和索引體系,這個體系到了用戶端可以迅速地構(gòu)建出一個有效的應(yīng)用,因為對外發(fā)布來講,基礎(chǔ)內(nèi)容有了,碎片化特征有了,欄目特征有了,主持人特征有了,里面的標(biāo)清語音特征有了,這就是云計算的過程。用人工校對的話,每個文字和畫面進(jìn)行精準(zhǔn)對應(yīng)的話,這個2分鐘的視頻沒有一天是做不出來的。這是建立公共云的必要性。

  這是平臺的商用情況。天脈這個平臺目前定義為視頻中國海量視頻云計算中心,定位為無錫國家物聯(lián)網(wǎng)產(chǎn)業(yè)園。目前天脈有三個機(jī)構(gòu),分別坐落于北京、無錫和上海,在北京主要做核心研發(fā),各種各樣模式識別的技術(shù),手機(jī)、終端技術(shù)、互動展示技術(shù),最近大家有沒有注意到央視的《豪門盛宴》“阿凡達(dá)”的事情都是天脈來做的,一方面要看源頭,有沒有東西,有了東西之后能不能賣出去,所以,我們在做第二個事情就是內(nèi)容怎么展現(xiàn)。

  整個天脈有400多號人,無錫云計算中心,每天有400多臺服務(wù)器源源不斷地處理著來自中國各地的電視節(jié)目,現(xiàn)在能處理200個頻道,2000檔欄目,3萬條信息。目前我們在無錫云計算中心已經(jīng)是世界最大的電視采集收錄基地,國外數(shù)量沒有這么多,這個模式可能不成立。

  因為各省、各城市都需要做這個事情,其實電視收錄本身是一個體力活,如果用人去做的話,有點太殘酷了,其實它就應(yīng)該讓機(jī)器去完成,但現(xiàn)在的形狀又不令人樂觀,很多地方都在建立小而全的小型收錄,效率非常低下,都是靠人一條處理的,這沒有必要。互聯(lián)網(wǎng)建立以后,異地采集,異地存儲,遠(yuǎn)程推送、互聯(lián)網(wǎng)交付都已經(jīng)變成一個很實在的東西了,不再是個概念了。天脈做這個事情已經(jīng)一年多了,我們現(xiàn)在已經(jīng)為很多大型用戶做異地采集,遠(yuǎn)程傳輸,成品推送這樣的服務(wù)。

  基于這一點,我們有一個比較多或者比較完善的技術(shù)體系來實現(xiàn),這個體系不是一個科研室的產(chǎn)品,也不是我們設(shè)計中的一個理念,而是實實在在在商用過程中的東西。一是海量的處理,當(dāng)你處理10個或者20個頻道都不算海量,當(dāng)你能處理幾千檔欄目就是海量。智能識別,語音識別的東西,很多用小軟件也可以看到,但用到商用上替代人這有一個過程,而且它適合不同方言,不同地域的過程也是很復(fù)雜的過程。

  模式識別,畫面比對,我們會知道什么是廣告,廣告與文字中的區(qū)別,也需要大量的廣告識別,而且怎么樣讓它通過Google搜索電視也是我們強(qiáng)調(diào)的。還有面對無數(shù)的終端,終端非常多,它的格式是什么樣的,有的是用戶原有的,有的是新格式的,所以需要非常強(qiáng)大的轉(zhuǎn)碼系統(tǒng),不是一兩個轉(zhuǎn)碼系統(tǒng)就可以了,而是需要云,吃進(jìn)去的是草,擠出來的是奶。整個服務(wù)器的云是播出云,提供分發(fā)和CNN流量的,我們這里沒有流量,就是簡單的信號流量進(jìn),成品出,但500臺服務(wù)器日夜咆哮,運(yùn)算量都比別人大,因為它真的在做復(fù)雜的視頻運(yùn)算。做云計算來講,包括存儲體系,并行工作的體系我們都做非常好的設(shè)計。異地從北京送到上海、無錫計算以后,經(jīng)過人工校對,這里面還會有5%會錯,人名、地名會錯,對國家的一些安全要求必須經(jīng)過人的審核,審核之后到成品中心進(jìn)行分解,分解之后做推送。

  天脈的案例不是做代工生產(chǎn)平臺,是幫助媒體挖掘出視頻影音的DNA,你表面上看是視頻,實際上是有DNA的,畫面特征有大量豐富信息,意味著你會有不同的表現(xiàn),比如深化同步的部分,在上海文廣他們有一個對海外華人的播出平臺,就是拿這種模式教中文,說中國的普通話,看中國時事的時候看著中國文字。這是一個商業(yè)資源,不僅僅是一個索引資源。

  天脈可以通過云計算把傳統(tǒng)的簡單索引變成立體標(biāo)引,視頻內(nèi)涵的標(biāo)引,而且它確實面向前端個性化的,我經(jīng)常會跟現(xiàn)在的一些用戶講,我們要搜一個NBA的比賽,很多人都會說我能找到,我想看火箭隊的比賽我也能找到,但看到姚明出場沒有,但沒有這個特征,因為電視上只有比賽沒有特征,看姚明扣籃的動作肯定沒有,但事實上我就想看姚明的比賽和扣籃,而現(xiàn)在要看姚明的比賽只能看場次,這不符合互聯(lián)網(wǎng)的消費(fèi)模式的習(xí)慣。互聯(lián)網(wǎng)的消費(fèi)模式是Google一搜就出來了,這個新的處理模式,技術(shù)比較復(fù)雜,必須構(gòu)建在云端,不能每家獨(dú)立建設(shè),煤價獨(dú)立建設(shè)也需要有龐大的技術(shù)成本在里面。

  天脈在給新媒體提供的服務(wù)理念里提到三塊:第一我們可以給各個地方做內(nèi)容代加工,開玩笑就是視頻領(lǐng)域的富士康,幫你加工內(nèi)容就可以了,但我雇傭的是機(jī)器不是人去做。第二我們幫你做好一套適合于新媒體的標(biāo)引體系,有了這個體系之后,你就可以快速標(biāo)引產(chǎn)品,標(biāo)引離你最近,最不能再做改造。第三創(chuàng)新模式或雙子電視的模式幫你構(gòu)建前端引用,我覺得這應(yīng)該是運(yùn)營商、用戶最關(guān)心的和我們最擅長的,因為這是我最擅長的。天脈從目前的技術(shù)現(xiàn)狀可以做到幾點,三天之內(nèi)可以完成異地電視臺的節(jié)目收購,五天就可以把成品送過去,七天就能幫您構(gòu)筑一套全業(yè)務(wù)的資源平臺,包括IPTV、手機(jī)和互聯(lián)網(wǎng),十分鐘就能讓用戶你的電視節(jié)目里播出的片斷,一毫秒你可以看到基于毫秒的鏡頭來。

  我的合作案例,目前都是積極比較大的合作案例,天脈云端目前支撐著國內(nèi)幾個大的客戶做,央視,央視需要大量的網(wǎng)絡(luò)信號和內(nèi)容,其它公司做不了,我們在給他們提供服務(wù),還有北京文廣、中國教育電視臺、陜西電視臺,安徽電視臺,全部資源平臺推送過去。這是我們給教育電視臺做的,這是給北京電視臺的“北京時間”做的,網(wǎng)絡(luò)電視、手機(jī)電視、TV社區(qū),互動點播都是我們做的;上海文廣SMG百事通IPTV的內(nèi)容,現(xiàn)在中國IPTV的內(nèi)容做得最成功的就是百事通平臺,有200萬用戶,上海本地100萬,江蘇100萬,無錫這個城市就20萬,央視在云南只有幾萬用戶,加在一起沒有文廣大,所以文廣最成熟。文廣現(xiàn)在實際上主要跟中國電信合作,中國電信提供機(jī)頂盒、計費(fèi),文廣負(fù)責(zé)分發(fā)、節(jié)目播控,但節(jié)目源文廣交給我們,直播節(jié)目是文廣推送的,而點播和搜索的內(nèi)容每一都是天脈來提供的,我們制作好的H.264編碼格式的標(biāo)清視頻流每天Push到上海文廣中心,由上海文廣中心Push到各地SMG來做審核,所以,他對我有要求,什么東西要做一兩小時,什么東西不能過夜等等,新聞類、影視類都交給我,手機(jī)上、網(wǎng)站上都交給我們做,其它電視電視臺。

  我們非常想把生產(chǎn)價值展示給前端,所以,我們給冬奧會做了全景大型活動,包括央視的豪門盛宴,這些素材都是通過網(wǎng)絡(luò)平臺挖掘的,主持人張斌通過網(wǎng)絡(luò)形式進(jìn)行了新的資源展示,而且做到傳統(tǒng)電視臺的內(nèi)容優(yōu)化和節(jié)目優(yōu)化里,帶來新的收視率,同時我們給上海世博局提供關(guān)于上海世博會的媒體監(jiān)測服務(wù)。

  我們愿意與在座合作伙伴精誠合作,共贏未來!謝謝大家!

搜狐IT 



相關(guān)閱讀:
華為總裁任正非:讓用戶像用電一樣享受云計算 2010-11-30
中國聯(lián)通:云計算架構(gòu)和運(yùn)營 2010-11-29
云計算架構(gòu)下的設(shè)備互操作性亟待解決 2010-11-08
三網(wǎng)融合、云計算等推動下 CDN將成基礎(chǔ)網(wǎng) 2010-11-08
曾鳴:移動互聯(lián)網(wǎng)發(fā)展需突破支付和云計算瓶頸 2010-10-20

熱點專題:  視像通信    云計算
分類信息:  云計算_與_電信
相關(guān)頻道:  云計算