您當(dāng)前的位置是:  首頁(yè) > 資訊 > 文章精選 >
 首頁(yè) > 資訊 > 文章精選 >

堅(jiān)守音視頻領(lǐng)域多年:是偶然,也是必然

2020-05-21 14:05:12   作者:劉華平   來(lái)源:LiveVideoStack   評(píng)論:0  點(diǎn)擊:


 
  十幾年持續(xù)專注于音視頻領(lǐng)域的在國(guó)內(nèi)確實(shí)不多,我能堅(jiān)守是偶然也是必然。早期的堅(jiān)持是興趣加上偶然因素,現(xiàn)在看到能夠通過(guò)技術(shù)來(lái)極大的提升人類在各方面應(yīng)用的效率時(shí),更多的則是必然。網(wǎng)易云音樂音視頻實(shí)驗(yàn)室負(fù)責(zé)人劉華平在采訪中說(shuō)到。
  LiveVideoStack:華平你好,我們是在2017年認(rèn)識(shí)的,當(dāng)時(shí)你還在“WiFi萬(wàn)能鑰匙”,說(shuō)說(shuō)你的近況吧。
  劉華平:是的,歷時(shí)一年,在從零組建WiFi萬(wàn)能鑰匙音視頻研發(fā)團(tuán)隊(duì),并且很好地支持了實(shí)時(shí)通話、音視頻編輯和播放相關(guān)業(yè)務(wù)。2017年8月份,網(wǎng)易云音樂在找合適的人來(lái)組建專注音樂業(yè)務(wù)的音視頻實(shí)驗(yàn)室,當(dāng)時(shí)跟云音樂CEO和CTO有過(guò)直接溝通。看到云音樂高層清晰的業(yè)務(wù)布局和對(duì)音視頻技術(shù)的重視,回想起當(dāng)年在阿里音樂沒能實(shí)現(xiàn)的一些想法,在這兩方面因素的影響下,讓我做出了加入云音樂的決定。
  2017年11月份,我正式加入云音樂,開始組建云音樂音視頻實(shí)驗(yàn)室,通過(guò)技術(shù)來(lái)提升覆蓋音樂內(nèi)容生產(chǎn)、宣發(fā)和消費(fèi)的效率以及用戶欣賞音樂的體驗(yàn)。音視頻實(shí)驗(yàn)室成立,很多經(jīng)驗(yàn)豐富的音視頻領(lǐng)域人才加入,極大的加快了云音樂產(chǎn)品矩陣落地的速度。
  2019年下半年,我同時(shí)兼任云音樂創(chuàng)新業(yè)務(wù)技術(shù)負(fù)責(zé)人,通過(guò)音視頻技術(shù)來(lái)支撐一些音樂新玩法 — 網(wǎng)易云音樂音樂旗下K歌App“音街”就是創(chuàng)新業(yè)務(wù)部門主導(dǎo)的產(chǎn)品。音街產(chǎn)品中K歌綜合評(píng)分、酷炫的歌詞和視頻動(dòng)畫都是音視頻技術(shù)驅(qū)動(dòng)產(chǎn)生的創(chuàng)新玩法。
  LiveVideoStack:在多家公司輾轉(zhuǎn),給你帶來(lái)了什么?你是追求自由的人嗎?
  劉華平:每到一個(gè)公司,都會(huì)給我?guī)?lái)三個(gè)方面的成長(zhǎng):
  1. 技術(shù)深度和廣度:由編解碼技術(shù),擴(kuò)展到前后端算法。從音頻到視頻,從傳統(tǒng)數(shù)字信號(hào)處理算法到深度學(xué)習(xí)。
  2. 行業(yè)的認(rèn)識(shí):最初是音視頻技術(shù)公司,只能向外面提供最底層的技術(shù)庫(kù),又多是海外市場(chǎng),至于用在哪里都不是很清楚;后來(lái)進(jìn)入基于音視頻技術(shù)應(yīng)用互聯(lián)網(wǎng)公司,平時(shí)的工作除了功能實(shí)現(xiàn),還通過(guò)運(yùn)營(yíng)大數(shù)據(jù)和用戶反饋來(lái)優(yōu)化和設(shè)計(jì)解決方案,一步步的由技術(shù)點(diǎn)到行業(yè)面的認(rèn)識(shí)成長(zhǎng)。
  3. 認(rèn)識(shí)與思考能力:現(xiàn)在對(duì)工作和生活、職業(yè)發(fā)展規(guī)劃、系統(tǒng)化思考等,好像都開始有點(diǎn)入門并且形成一套自己的方式,能以很好的心態(tài)去面對(duì)人和事。我自律性不錯(cuò),同時(shí)也是追求自由的人,體現(xiàn)在只要能高效的完成某些任務(wù),我不怎么注重形式。
  LiveVideoStack:是什么驅(qū)動(dòng)你去創(chuàng)業(yè),再而回歸職場(chǎng)?
  劉華平:我有兩次創(chuàng)業(yè)經(jīng)歷,第一次是2013年,那次更多的是項(xiàng)目驅(qū)動(dòng),沒有更多的規(guī)劃和想法,堅(jiān)持一年又沒再堅(jiān)持;2016年進(jìn)行第二次創(chuàng)業(yè),是跟幾位有成功創(chuàng)業(yè)經(jīng)歷的朋友一起做一個(gè)音視頻技術(shù)為主的技術(shù)型公司。當(dāng)時(shí)我是CTO,跟著聯(lián)合創(chuàng)始人一起思考方向、尋找投資,先后見了十幾家投資機(jī)構(gòu),最后由于某些原因也沒能持續(xù)下去。
  創(chuàng)業(yè)讓我更好的理解到行業(yè)和平臺(tái)的重要性,認(rèn)識(shí)到創(chuàng)業(yè)其實(shí)也是在尋找實(shí)現(xiàn)自我的平臺(tái)后,如不能自己去搭建,那就尋找一個(gè)可以實(shí)現(xiàn)自身價(jià)值的大平臺(tái),這也就是我創(chuàng)業(yè)后,再選擇回歸職場(chǎng)的根本原因。
  LiveVideoStack:從硬件開發(fā)到軟件開發(fā),從外企到本土互聯(lián)網(wǎng)公司,再到網(wǎng)易云音樂,他們有何不同?你更喜歡哪種?
  劉華平:截止到現(xiàn)在,十幾年的職業(yè)生涯,先后在freescale、visualon、盛大創(chuàng)新研究院、阿里巴巴、WiFi萬(wàn)能鑰匙和網(wǎng)易云音樂任職。公司在變化,但自己專注的音視頻方向一直沒有改變。不同的階段以及公司,都讓我學(xué)到很多東西。
  我的代碼習(xí)慣和一些流程化的管理是當(dāng)年在freescale和visualon學(xué)的,外企在這方面做得真的很到位,code review和版本管理做得很細(xì);
  盛大創(chuàng)新研究院當(dāng)年是國(guó)內(nèi)互聯(lián)網(wǎng)牛人最多的地方,在這里讓我原來(lái)點(diǎn)狀的音視頻技術(shù)形成面,有產(chǎn)品化思維,同時(shí)也把我?guī)氲搅藢?shí)時(shí)視頻這個(gè)應(yīng)用領(lǐng)域。當(dāng)時(shí)參與過(guò)的類似于早期YY語(yǔ)音類似的易聊項(xiàng)目,語(yǔ)音3A算法、音效、丟包補(bǔ)償就是從那時(shí)候開始更加專業(yè)去做;
  阿里巴巴的工作經(jīng)歷,讓我有了全局觀和系統(tǒng)化思維的能力。阿里針對(duì)P8及以上的人員,有很多相關(guān)的培訓(xùn),例如湖畔學(xué)院課程等。這些課程的學(xué)習(xí)和在平時(shí)工作中的應(yīng)用,讓我認(rèn)識(shí)到做事專注和深度思考的重要性;
  在WiFi萬(wàn)能鑰匙,使我獲益最多的應(yīng)該是WiFi萬(wàn)能鑰匙創(chuàng)始人陳大年,年總每次在公司生日會(huì)上的互動(dòng)分享,我都會(huì)認(rèn)真作記錄,過(guò)后反復(fù)看。年總以數(shù)據(jù)驅(qū)動(dòng)產(chǎn)品功能以及工作與家庭平衡的理念,對(duì)我產(chǎn)生了極大的正向影響;
  網(wǎng)易云音樂組織結(jié)構(gòu)扁平化,團(tuán)隊(duì)充滿活力,你有好的想法可以直接找到云音樂任何一位高層交流并能得到很專業(yè)的點(diǎn)評(píng)。云音樂團(tuán)隊(duì)在產(chǎn)品設(shè)計(jì)和技術(shù)與產(chǎn)品的結(jié)合方面做得很到位。例如做音樂行業(yè),云音樂是看到音樂背后的人,將服務(wù)好獨(dú)立音樂人和用戶作為所有工作中的重點(diǎn)。
  總得來(lái)說(shuō),經(jīng)歷過(guò)的每一家公司,我都會(huì)積極參與,同時(shí)懷著空杯心態(tài)去學(xué)習(xí),對(duì)所有公司都是心懷感恩,只能說(shuō)我更喜歡當(dāng)下的狀態(tài)。
  LiveVideoStack:是什么力量讓你守望音視頻領(lǐng)域這么多年?
  劉華平:十幾年持續(xù)專注于音視頻領(lǐng)域的在國(guó)內(nèi)確實(shí)不多,我能堅(jiān)守是偶然也是必然。早期的堅(jiān)持是興趣加上偶然因素,現(xiàn)在更多的是必然。
  我讀研時(shí)跟著導(dǎo)師做語(yǔ)音識(shí)別方面的課題,也就偶然的進(jìn)入人類主要信息獲取渠道-語(yǔ)音的研究領(lǐng)域。為了能更好的整理自己的所學(xué)知識(shí),畢業(yè)后我在博客園以筆名 “劉品”開始專注于寫音頻相關(guān)的博客。堅(jiān)持了幾年,博客熱度也很高,通過(guò)博客經(jīng)常跟國(guó)內(nèi)外很多做音頻算法的人交流,讓我學(xué)習(xí)了很多東西,使我的專業(yè)知識(shí)從深度和廣度上得到了加強(qiáng)。
  音視頻領(lǐng)域其實(shí)是一個(gè)演進(jìn)很快的行業(yè),例如音頻編碼器從MP3到AAC再到MPEG-H,視頻H264到H265,VC1等。算法也從傳統(tǒng)到AI相關(guān),應(yīng)用場(chǎng)景也是越來(lái)越豐富。看到能夠通過(guò)技術(shù)來(lái)極大的提升人類在各方面應(yīng)用的效率時(shí),守望音視頻領(lǐng)域就成為我現(xiàn)在的必然選擇。
  LiveVideoStack:我注意到你在本科階段就選擇“人工智能與自動(dòng)化控制”,這是你主動(dòng)選擇的嗎,那可是20年前的事了。
  劉華平:我很感恩這個(gè)時(shí)代和自己的運(yùn)氣,早期我很多選擇都是被動(dòng)的,但現(xiàn)在來(lái)看當(dāng)初的選擇還算不錯(cuò)。本科的專業(yè)其實(shí)是調(diào)劑的,當(dāng)時(shí)最火的是“計(jì)算機(jī)軟件”,因分?jǐn)?shù)不高,被調(diào)到機(jī)自學(xué)院的“自動(dòng)化控制”,因?yàn)槟菚r(shí)這個(gè)專業(yè)跟人工智能是最靠邊的,在這期間我學(xué)習(xí)了很多跟人工智能相關(guān)的編程語(yǔ)言。
  LiveVideoStack:人工智能,或者深度學(xué)習(xí)真的可以改變多媒體的生產(chǎn)和消費(fèi)嗎?具體到在網(wǎng)易云音樂,你們做了哪些探索?
  劉華平:人工智能對(duì)多媒體的生活和消費(fèi)產(chǎn)生了極大的影響。目前來(lái)看,人工智能場(chǎng)景化應(yīng)用在音視頻(看與聽)領(lǐng)域得到了極大的發(fā)揮。例如深度學(xué)習(xí)推動(dòng)了語(yǔ)音識(shí)別、合成、視覺相關(guān)技術(shù)的發(fā)展。
  網(wǎng)易云音樂自2018年底就開始在內(nèi)容創(chuàng)作、分析和消費(fèi)中尋找AI能切入的應(yīng)用場(chǎng)景,目前已取得相當(dāng)不錯(cuò)的成績(jī),在改善用戶體驗(yàn)的同時(shí)提高了音樂產(chǎn)業(yè)鏈各環(huán)節(jié)的效率。
  • 內(nèi)容創(chuàng)作方面,我們通過(guò)AI對(duì)音樂樂理進(jìn)行分析,形成內(nèi)容創(chuàng)作方面的知識(shí)庫(kù),目的是提早發(fā)現(xiàn)用戶喜歡的新歌并有針對(duì)性的進(jìn)行運(yùn)營(yíng)。
  • 內(nèi)容分析與處理方面,我們通過(guò)AI開發(fā)性能優(yōu)于spleeter的消音伴奏算法、音樂結(jié)構(gòu)分段。現(xiàn)在音街用的K歌伴奏庫(kù)元素絕大部分是通過(guò)這套算法自動(dòng)實(shí)現(xiàn)的。
  • 內(nèi)容消費(fèi)相關(guān)的個(gè)性化推薦中有很多標(biāo)簽都是通過(guò)AI來(lái)打的,推薦不再是僅僅基于用戶行為,音樂樂理本身也成為歌曲推薦較為重要的衡量維度。
  AI在音樂中的應(yīng)用才剛剛開始,效果較為依賴于場(chǎng)景與訓(xùn)練數(shù)據(jù)覆蓋,網(wǎng)易云音樂非常期待能通過(guò)更多的技術(shù)來(lái)助力中國(guó)音樂產(chǎn)業(yè)。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)