首頁 > 新聞 > 國內 >

語音識別創(chuàng)業(yè)公司云知聲換帥 黃偉從幕后走向臺前

2013-12-25 14:21:58   作者:   來源:騰訊科技   評論:0  點擊:


  語音識別領域的明星創(chuàng)業(yè)公司云知聲正在經歷一場隱秘的高層架構調整。

  騰訊科技獨家獲悉,公司CEO梁家恩不再擔任公司CEO,轉而專注負責技術領域。公司CEO由黃偉擔任,正式上任已有一周有余。

  云知聲的官方網站側面印證了該消息的真實性。云知聲在公司內部的新聞稿通報,云知聲榮獲中國最具投資價值企業(yè)50強的稱號,云知聲CEO黃偉出席了本次大會并領獎,新聞稿并配了黃偉領獎的照片。

黃偉

  在外界看來,這似乎是空降兵式的調整。在語音識別業(yè)內的知情者看來,則是語音識別產業(yè)核心人物的回歸。

  “黃偉終于回歸了,終于從幕后走向了前臺”。一位語音識別的業(yè)內人士這樣感慨。

  黃偉是誰?作為語音識別領域的領軍人物,他先就職于摩托羅拉和盛大創(chuàng)新院,建立了盛大創(chuàng)新院語音分院,后隨著盛大整體戰(zhàn)略的調整,他于2012年離職選擇創(chuàng)業(yè)。

  對于黃偉創(chuàng)業(yè)的說法不一。盛大創(chuàng)新院員工表示,黃偉是盛大創(chuàng)新院高管中最早離開創(chuàng)新院的,他去創(chuàng)辦了云知聲。但在此前,云知聲官方否認黃偉在這個團隊中。

  今年10月,云知聲確認完成啟明創(chuàng)投的A輪融資,金額達1億人民幣,此時,云知聲公司成立剛過500天。云知聲的迅速躥紅也引起了業(yè)內人士對它的關注,也牽出了黃偉與云知聲的聯(lián)系:“黃偉不是明面上的公司創(chuàng)始人,更多的是和云知聲私下里的關系。雖然沒有確切的證據表明兩者的關系,但實際上千絲萬縷,兩者走的非常近。”一位知情人士透露。

  騰訊科技獲悉,此次黃偉正式擔任CEO,與其從盛大離職后的競業(yè)禁止協(xié)議解禁有關。“云知聲這一年的飛速成長,與黃偉的幕后操盤緊密相關。”上述人士表示。

  對此安排,有知情人士透露,黃偉對資本方等較為熟悉,更容易掌控全局。梁家恩是典型的技術型人才,專注技術更為適合。“在盛大創(chuàng)新院時黃偉是梁家恩的領導,創(chuàng)業(yè)后先由梁家恩擔任CEO,黃偉在幕后。條件許可后,黃偉再走到前臺,這很順利成章。”

  作為創(chuàng)業(yè)公司,云知聲一年的成長有目共睹。“在語音識別領域,百度已經做了一年多,云知聲也做了一年多,但是云知聲的識別技術比如識別的準確度已經比百度高出一大截。”一位語音識別的從業(yè)人士這樣評價,“在語音識別的創(chuàng)業(yè)公司中,云知聲是做的最好的。”

  梁家恩把創(chuàng)業(yè)的階段性成功歸因于強大的核心技術團隊和平臺技術團隊,能夠在一年時間里,實現(xiàn)上市公司需要3-5年才能構建的語音識別服務平臺。“一年來,語音識別錯誤率下降60%,識別速度提高3倍以上。”云知聲CEO梁家恩對騰訊科技表示。

  在這個節(jié)點上,在語音識別領域的大爆發(fā)的前夜,復盤云知聲一年的黑馬式崛起,頗有一番意味。

  語音識別產業(yè)大爆發(fā)

  “所有手機制造商都在投資語音、拓展語音技術領域的投資,打造更優(yōu)雅的設計并 將其深入集成到手機中。”美國最大的語音識別技術公司Nuance高級副總裁邁克爾?湯普森這樣說。

  在推出Siri應用兩年后,今年蘋果在麻省理工大學 (MIT)附近組建神秘辦公室,用以做Siri 語音識別技術的研發(fā)。微軟正在研發(fā)代號為“Cortana”自有語音個人助手軟件,并計劃在下一個Windows Phone平臺大升級中推出,以抗衡Google Now及Siri。至此,蘋果、谷歌(微博)、微軟、英特爾等國際巨頭均重金投入語音識別技術。

  在中國市場上,語音識別技術公司也有幾大派別較力:

  第一派來自互聯(lián)網巨頭在語音識別技術上的布局,比如騰訊、百度、搜狗等圍繞自己的產品生態(tài)系統(tǒng)做語音技術,用來為產品服務。微信的語音對講應用已經成為人們日常聯(lián)絡的必備。360也有意進軍語音識別領域,曾傳出與科大訊飛談合作事宜,但至今未有明確信息。

  第二派來自專業(yè)的語音語義識別公司在移動互聯(lián)網上的延伸。比如科大訊飛去年專門成立移動互聯(lián)網事業(yè)部做移動應用,美國的Nuance在上海也設立辦事處拓展以多語種語音識別應用為主的中國市場。

  第三派來自于新興的創(chuàng)業(yè)公司,如云知聲、思必馳等,具有互聯(lián)網公司的基因,長 勢兇猛。還有一派專做部分語音語義技術的應用,比如擅長語義解析的蟲洞(獲微軟首期云加速器項目支持)、智能360(周鴻祎(微博)做天使投資),以及做微信語音 生活搜索的出門問問(前谷歌語音識別技術員工李志飛創(chuàng)辦),他們自己做語音語義識別應用的一部分,另一部分技術會借助科大訊飛等廠商的技術來完成。

  剛剛過去的幾個月,基于語音識別技術的角力進入前所未有的白熱化階段。 9月7日,創(chuàng)業(yè)公司思必馳宣布重新定義人機交互體驗的方向,高調推出基于語音識別和語義理解的人機對話。9月中旬,老牌語音技術公司科大訊飛宣布自主研發(fā)的離線語音聽寫引擎將于9月下旬正式發(fā)布,將應用于“訊飛輸入法”等產品。10月19日,云知聲在確認融資消息的同時,也發(fā)布了離線語音聽寫技術,并發(fā)布了語義云。今年10月28日,科大訊飛語音云發(fā)布三周年,訊飛語音輸入法用戶超過1億。

  黃偉的故事

  在這輪語音識別技術熱潮中,有個身影本該成領頭羊但卻落寞四散缺席,那就是盛大。

  與科大訊飛相比,盛大當年的語音識別技術并不弱。曾經領導盛大的語音識別團隊的核心人物是黃偉。同劉慶峰一樣,黃偉畢業(yè)于中國科學技術大學,2004年加入摩托羅拉中國研究中心(MCRC)擔任資深研究員。在摩托羅拉工作期間,他帶隊開發(fā)出世界上首個手機聲紋認證系統(tǒng),并完成多項語音交互產品研發(fā)。但在金融危機期間,摩托將整個語音識別團隊出售給Nuance。

  黃偉拒絕被Nuance收編,于2009年7月加入盛大網絡旗下的創(chuàng)新院,2010年10月創(chuàng)建了語音分院,力圖將語音識別技術與盛大旗下的互動娛樂系統(tǒng)相結合,延展到用戶端。

  2010年,盛大語音團隊在美國國家標準技術署(NIST)舉辦的聲紋識別評測(SRE)大賽中,力壓麻省理工、斯坦福研究中心、IBM等眾多名校、名企,在在9個單項任務中獲得5個單項第一,整體綜合指標第一。

  梁家恩畢業(yè)于中國科學技術大學,隨后進入中科院自動化所工作,2011年加入 盛大創(chuàng)新院,在盛大語音分院工作,擔任高級研究員一職。不過,隨著2012年盛大創(chuàng)新院的戰(zhàn)略調整,語音團隊從創(chuàng)新院剝離到盛大掌門科技,由陳大年掌管。語音團隊的成員開始各尋出路。

  盛大語音團隊的幾個人選擇了創(chuàng)業(yè),同樣做語音識別,定名為“云知聲”。但云知聲更傾向于強調自己的技術積累來自于中科院自動化所,而非之前曾工作過的盛大。

  黃偉在其中的角色耐人尋味。

  2012年夏天,盛大創(chuàng)新院離職員工QQ群里,傳來了黃偉創(chuàng)辦云知聲的消息。一位前盛大創(chuàng)新院員工表示,“黃偉是盛大創(chuàng)新院高管中最早離開創(chuàng)新院的,他去創(chuàng)辦了云知聲。”

  但云知聲官方否認黃偉在云知聲團隊中。

  來自云知聲的官方消息顯示,公司創(chuàng)始人有兩位,一位是梁家恩,擔任公司CEO,另一位是康恒,擔任公司CTO,負責平臺業(yè)務部。

  對于黃偉與公司的關系,騰訊科技曾向云知聲市場負責人求證此事。該負責人表示,“黃偉和我們公司沒有什么關系。”但他也表示,黃偉和梁家恩是師兄弟關系,也會指導云知聲的業(yè)務。

  云知聲的內部人士透露,黃偉離開盛大研究院后創(chuàng)辦了移動互聯(lián)網應用音樂雷達,和云知聲團隊在同一座大廈辦公。網站信息顯示,兩家公司都在北京海淀區(qū)財智國際大廈C座,云知聲在15層,音樂雷達在19層。

  音樂雷達的一家合作伙伴的負責人證實黃偉是音樂雷達的創(chuàng)始人之一,并和黃偉談過音樂方面的合作。對于外界對黃偉和云知聲之間關系的猜疑,他表示,“不出面創(chuàng)立公司,但可能通過代持的方式運營公司,這在圈里也比較正常。”

  互聯(lián)網的節(jié)奏

  對云知聲而言,過去一年來,以快取勝、唯快不破的節(jié)奏在語音識別領域快速擴張業(yè)務,打造知名度。在與其他公司的語音技術解決方案不相上下的情況下,云知聲采取先搶占市場后再優(yōu)化的策略。

  去年11月,云知聲和搜狗語音助手達成合作,今年3月,和錘子科技達成合作,5月和樂視TV達成合作,8月又和inwatch、易信達成合作。云知聲和科大訊飛比肩一道出現(xiàn)在在小米、聯(lián)想、智能360語音助手等很多合作伙伴的語音識別方案中。

  梁家恩透露,從和搜狗團隊見面到第一個產品模型出來只花了兩個星期,而這個時間可能其他公司連商務條款還談不下來。樂視電視的合作也類似,從第一次和樂視團隊接觸到內部系統(tǒng)跑通到在發(fā)布會上發(fā)布只用了1個月的時間。

  還有一個合作客戶——錘子科技。CEO羅永浩出了名的挑剔。今年,錘子ROM發(fā)布會前一周,老羅在抱怨語音識別方案遲遲未出,當晚云知聲公司CTO已經將產品集成和錘子科技團隊進行對接。最終,云知聲和科大訊飛同時入圍錘子ROM的語音解決方案。

  與之前的課題研究迥然不同,梁家恩發(fā)現(xiàn),創(chuàng)業(yè)一年來,團隊一直糾結技術層面的東西,他認為和實際業(yè)務結合更關鍵,也更重要。“做成也是技術好,做失敗也是技術好”。

  自去年發(fā)布語音識別公有云以來,平臺上已經有1000個開發(fā)者加入。通過該開放平臺,“可以把門檻降得足夠低,開發(fā)者無需懂具體的語音語義技術,只需要調用云知聲的服務,就可做應用創(chuàng)新。”

  在開放平臺背后,隱藏著云知聲的商業(yè)模式邏輯:通過語音語義平臺將各家的App聯(lián)通,用戶數(shù)據也會集中到平臺上,將各個環(huán)節(jié)貫通從而實現(xiàn)廣告等商業(yè)價值。

  梁家恩把它比擬為一種類似Google adsense的模式,雖然每家的量很小,但是通過聚合可以產生商業(yè)利益,各個參與方可以分成。

  互聯(lián)網的創(chuàng)業(yè)節(jié)奏讓云知聲嘗到了甜頭,接下來也有風險和挑戰(zhàn)。

  一個是來自平臺化的風險。“騰訊、百度做語音識別都是圍繞自己的主營來設計,在生態(tài)系統(tǒng)內來做,也會進行開放平臺的建設。”上述語音識別的從業(yè)人士認為,相比較其他已經有穩(wěn)定商業(yè)模式的公司涉足語音識別應用而言,初創(chuàng)公司做平臺的風險更大。

  對云知聲而言,另一個隱憂是尚未有核心的移動互聯(lián)網產品。目前來看,云知聲嘗試做語音輸入法插件,但主要業(yè)務是從語音識別解決方案切入,走技術驅動路線。“創(chuàng)業(yè)公司必須有自己的產品和服務,沒有產品,很難承載用戶數(shù)據,商業(yè)利益挖掘更難。”

分享到: 收藏

專題