您當前的位置是:  首頁 > 新聞 > 文章精選 >
 首頁 > 新聞 > 文章精選 >

普強信息何國濤:在語音分析和車載語音市場要比科大訊飛跑得更快

2017-08-02 11:42:13   作者:崔艷   來源:Xtecher   評論:0  點擊:


普強信息何國濤:在語音分析和車載語音市場要比科大訊飛跑得更快
  在成為語音數(shù)據分析市場的NO.1之后,何國濤的下一個戰(zhàn)場,是800億的車載語音市場。他不甘心等待行業(yè)大佬們的分割,他想拼盡全力跨越金字塔的塔尖。把這套系統(tǒng)作為入口,將更多的數(shù)據收入囊中。再通過大數(shù)據分析,徹底改變整個汽車服務生態(tài)及周邊行業(yè)。
  車載語音市場,將要迎來一位挑戰(zhàn)者。普強信息已進入語音數(shù)據分析和車載語音并行的時代。
  “繼續(xù)做,干嘛要停?”
  接觸計算機30年,做語音20年的何國濤,并不想停止他在語音分析領域的腳步。他在2009年創(chuàng)立的普強信息科技有限公司現(xiàn)在已經坐穩(wěn)中國市場語音大數(shù)據分析行業(yè)第一的寶座,接下來,他瞄準的是車載語音的戰(zhàn)場。
  數(shù)據顯示,語音交互的市場規(guī)模預計將超過200億美元。國內外IT巨頭,包括車廠都在想盡辦法涉足這個領域,搶奪語音交互的賽道。亞馬遜開放Echo音箱的語音識別技術;Facebook創(chuàng)始人扎克伯格去年自己花100小時完成AI管家Jarvis的開發(fā);而在國內,除了BAT們在抓緊時間謀篇布局,思必馳、云知聲、聲智科技、Rokid等創(chuàng)業(yè)公司也在發(fā)力這個領域。
  2015年,普強切入車載場景,聯(lián)手四維圖新和騰訊,共同開發(fā)出“云+端+芯片”的智能車聯(lián)網大數(shù)據系統(tǒng)。
  何國濤知道,這一戰(zhàn),他要跑得比科大訊飛更快。
  不斷膨脹的夢想
  何國濤思索了一下,說:“我發(fā)現(xiàn),我開始欠他們一個夢想”。
  這個名為“普強信息”的夢想包含了太多人的期待。2009年創(chuàng)立普強信息的時候,何國濤只想當好一個程序員,和喜歡的人一起做有價值的事情,花兩年時間寫程序,然后賣掉。
  “誰知道,兩年過后,程序寫完了,為了證明程序有用,需要自己回國找客戶。找了之后發(fā)現(xiàn)確實賣不掉,又要重新在上面加一層再加一層,加人、加錢,又要去找投資人。到最后,終于有了客戶。”
  但是程序員何國濤不知不覺間已經轉身成為普強信息CEO何國濤。
  他要完成投資人和員工們的夢想。把普強信息做成語音數(shù)據分析市場的第一,做出世界最好的人機交互系統(tǒng),讓員工能在北京買得起房子……
  這個不斷膨脹的夢想起源于何國濤9歲時。當時的他和澳門其他孩子沒有什么區(qū)別,愛做大他3歲的哥哥后面的跟屁蟲。唯一不一樣的地方,可能就是兄弟倆早早就表現(xiàn)出對數(shù)學異乎尋常的天賦。
  因為家庭經濟拮據,兄弟倆想用其他方法賺零花錢。當時澳門對于童工的各項規(guī)范尚未健全,哥哥就帶著弟弟出去打暑期工。整個暑假都在制衣廠里剪線頭,把賺到的錢偷偷存起來。攢了兩年,一數(shù),竟然有3000多元。
  這筆巨款最后變成了一臺蘋果電腦。兄弟倆就在這部電腦上玩游戲,玩膩了就考慮能不能把游戲修改一下,于是哥哥又帶著何國濤,靠著一本書自學編程。
  在興趣作為源動力的時間里,兄弟倆靠著這臺電腦,寫編程參賽。1989年,何國濤被保送到華僑大學,選擇了計算機專業(yè)。“也沒有什么高大上的理由,只是覺得計算機容易找工作”。
  大學的前兩年,何國濤迷失了方向。在學生會、辦酒會、做兼職,他知道這樣的狀態(tài)不能延續(xù),但是又不知道該往哪走。
  這時,在北京大學物理系讀研的哥哥問他:“北大還不錯,要不要過來試一下?”
  本科畢業(yè),何國濤考上了北京大學的網絡研究室。在北大,何國濤開始深入接觸計算機網絡,跟著導師為廣東建設銀行寫一個基于TCP-IP的銀行網絡中間件,對方非常滿意,以一套100萬的價格購買,產品非常成功,后來還賣給了多家銀行。
  何國濤所在的網絡實驗室,就是著名的北大“天網”項目成立的地方,北大天網是國內第一個基于網頁索引搜索的搜索引擎。在這個被譽為國內中文搜索領域一面旗幟的天網項目中,培養(yǎng)出一批國內早期的互聯(lián)網搜索領域人才。何國濤的師兄,劉建國、雷鳴、周利民,后來跟隨當時名不見經傳的李彥宏,成為了“百度七劍客”。
  何國濤沒有留下,他再次選擇跟隨哥哥的步伐,來到美國雪城大學(SyracuseUniversity)。3年后,身處硅谷的哥哥再次問他:“硅谷這邊還不錯,要不要過來試一下?”
  何國濤點了點頭。
  語音數(shù)據分析市場的NO.1
  在硅谷,何國濤做了很多次嘗試。他曾在HP、Arubanetworks等公司從事Opencall、VoiceXML、無線網關等產品的研究和開發(fā),HP多媒體服務器的語音識別技術,就是他所在的小組研發(fā)的。他對創(chuàng)業(yè)公司情有獨鐘,精兵、高效、靈活,非常符合何國濤的追求。
  “決定創(chuàng)業(yè)的時候,我本想著做兩年,把產品做好了就夠了”。沒想到,光是語音識別引擎,何國濤的團隊就寫了5年。
  這對何國濤來說,是異常艱辛的5年。整個普強信息團隊整天寫算法,方向從一開始的圖像識別轉移到語音識別,他們唯一的產出就是代碼,但是這些代碼能不能變成真金白銀,還是一個未知數(shù)。
  語音識別是底層技術,可以與口語教育、安防、監(jiān)聽,甚至機器人完美結合。何國濤也探索過移動APP,做過訂票系統(tǒng)和在線教育的產品,但是始終達不到標準。
  “如果你做一兩年完成的產品,別人花一兩年也能做出來,產品就沒有太大的價值。所以他一直要求我們要做到很深很深,做出一件別人需要花十年才能做出的東西。”
  何國濤口中的“他”就是黃炎松。這位硅谷華人圈里最成功的創(chuàng)投家,成為何國濤創(chuàng)業(yè)道路上的引路人,同時,也是普強信息的天使投資人。
  當時的黃炎松已經60多歲,成功帶領4家公司在美國上市,他沒有像其他投資者一樣急于求成,反而提高了對普強信息技術實力的要求。
  有了產品,何國濤把公司從美國加州硅谷轉移到國內運營。找客戶,何國濤找到了當年在北大的師弟雷鳴,此時的雷鳴已經離開百度,自創(chuàng)門戶建立了酷我音樂。而另一位師弟劉建國,身份也從百度的CTO轉換成了生活搜索網站愛幫網的CEO。
  后來,酷我音樂和愛幫網,開始嵌入普強智能的語音搜索引擎。慢慢地,何國濤發(fā)現(xiàn),和這些移動互聯(lián)網APP的合作,很難找到贏利點。這讓他陷入焦慮。
  此時,普強信息遇到第一個大客戶,聯(lián)想。負責的是呼叫中心的數(shù)據分析和語音識別。這次合作,讓何國濤見識到了大公司對語音識別的巨大需求以及背后雄厚的利潤回報。
  何國濤開始分析科大訊飛的財報,他發(fā)現(xiàn),作為語音技術領域當仁不讓的老大,科大訊飛在語音數(shù)據分析上每年能獲得3000萬的收入,而在系統(tǒng)集成、安防、教育領域的盈利以億的規(guī)模計算。作為盈利能力最強的云數(shù)據分析,卻沒有被放在最受重視的位置。何國濤發(fā)現(xiàn)了其中隱藏著的機會。他決定,“打他的弱項”。
  于是何國濤決定專注于語音數(shù)據分析領域。
  2010年,普強科技推出了“千語語音識別引擎系統(tǒng)”和“千語千尋語音分析系統(tǒng)”。
  這款引擎的開發(fā)應用了深度神經網絡技術,通過語音切分技術和對識別結果的算法,進行語速探測、情緒識別等,以及對講話對象、時間邊界等進行分割,不僅提高了語音識別結果,也可以輔助企業(yè)進一步挖掘和分析海量語音數(shù)據。
  千語千尋語音分析系統(tǒng)面向呼叫中心,在客服與顧客通話過程中,將不同方言的來電轉換成文字,還能根據不同的系統(tǒng)用戶需求,標注出關鍵用詞,并針對其進行統(tǒng)計和專業(yè)化分析,挖掘客戶需求。
  “快”和“準”,是語音分析市場顛撲不破的標準。千語千尋語音分析系統(tǒng)的全文識別率可達85%以上,關鍵詞識別率達95%以上。中文語音分析速度國內最快,它擁有的文本分析引擎和索引處理技術,能夠實現(xiàn)分析操作在秒級以內完成,而業(yè)內多數(shù)語音公司的產品則要半小時甚至更久。
  “當時我就跟客戶說,我們現(xiàn)在的分析系統(tǒng)就分析這塊,15秒出結果,而其他競爭對手需要2個小時。”目前普強在業(yè)界公開招投標的項目中,中標率能達到70%。“我們拿什么打敗科大訊飛那種積淀和實力雄厚的大企業(yè),只有產品、服務和口碑。”
  隨著2014年底與保險電銷的龍頭企業(yè)招商信諾開始深入合作,經過三年的發(fā)展,普強已經和數(shù)十家大型保險、銀行和互聯(lián)網金融公司進行合作,占據了金融行業(yè)語音分析市場的80%份額。
  2017年FINTECH金融科技的概念,也無意間驗證了何國濤當年的判斷。
  隨著語音數(shù)據分析市場的領先地位確立,何國濤又開始思考起人機對話主要剛需場景:車載語音。
  看準800億的車載語音市場
  800億的車載市場,就是何國濤對準的阿喀琉斯之踵。
  2015年,何國濤帶領著普強信息切入車載場景,聯(lián)手四維圖新和騰訊,共同開發(fā)出“云+端+芯片”的智能車聯(lián)網大數(shù)據系統(tǒng)WeDrive。
  四維圖新是國內領先的綜合地理信息服務提供商,其數(shù)字地圖一直主導中國前裝車載導航市場,合作品牌幾乎囊括國內各大主流車廠。近年來,在四維圖新CEO程鵬的領導下,采取創(chuàng)新+戰(zhàn)略投資的“雙輪驅動”策略,由傳統(tǒng)地圖轉向車聯(lián)網和自動駕駛。正是何國濤對四維這一戰(zhàn)略的強烈認同,最終接受了四維的投資。
  在這次聯(lián)姻中,四維負責導航,騰訊負責內容,普強提供語音交互技術。相對于群雄逐鹿的后裝市場,市場份額更穩(wěn)定、價值收入更高的前裝市場更具吸引力。全球老大Nuance占了較大的份額,國內龍頭科大訊飛也躍躍欲試。但在另一方面,出品周期長和對接流程復雜也擋住了吃螃蟹者的腳步。
  何國濤的智能車載語音系統(tǒng),是由“云+端+芯片”組成的。普強自主研發(fā)的云+端語音交互系統(tǒng)能有效的避免車內網絡不通對語音識別的影響。另外方案中的陣列麥克風可抑制噪音回音,進行聲源定位。車載降噪DSP芯片可進行車載降噪去回聲。
  此外,為了極致的用戶體驗,普強會針對不同車輛本身的胎躁、風噪、發(fā)動機噪等噪音特性,量身定制屬于該款車輛的聲學模型算法,提高行駛過程中的語音識別率。
  何國濤想要的不僅是這塊市場,更是想把這套系統(tǒng)作為入口,將更多的數(shù)據收入囊中。
  百度首席科學家吳恩達曾說過,“語音識別從95%的準確度到99%的準確度帶來的不是量變而是質變,是從你偶爾使用語音變到常常使用。做到99%準確,將徹底改變人與設備的交互。”
  當時,吳恩達正在百度負責“百度大腦”項目,而作為基礎的就是百度的語音技術。BAT也有意涉足語音分析領域,他們最大的優(yōu)勢在于海量的數(shù)據。
  沒有人會比何國濤更了解數(shù)據的價值。但是如何以道德的方式收集數(shù)據,更好地運用數(shù)據為用戶服務,何國濤想了很多種方法。比如車險。
  “中國的車險市場是大概6000億,現(xiàn)在的車險大多采用平均主義,與你的駕駛時間和習慣無關。我可以把車機系統(tǒng)免費送給駕駛習慣良好的司機,在這一年內,通過系統(tǒng)記錄到的數(shù)據證實沒有違規(guī)行為,年底用戶買車險就可以減免一大塊費用。
  對于用戶來說,這是看得見摸得著的好處。激勵司機追求更好的駕駛行為,對于社會的交通狀況有益。對于普強信息來說,這一年積累下來的駕駛數(shù)據,能夠讓他們看得更深更遠。
  另一方面,何國濤還想過,針對暴雨等惡劣天氣,推出短時間的保險。“你從家里到公司是五公里,半個小時就到了,你害怕這段路車子會被暴雨沖走,就可以通過車機系統(tǒng)買一個半小時的保險,系統(tǒng)實時監(jiān)控,結束之后自動計算金額,可能兩毛錢,你只需要在車里面點了一下說:“好,同意。”
  把這些數(shù)據通過符合法律和道德的方式挖掘出來,通過數(shù)據分析和模擬,可能會在不遠的未來徹底改變整個汽車服務生態(tài)及周邊行業(yè)。
  越過塔尖的勇氣
  “大客戶將從目前70左右擴展到100個,在車載系統(tǒng)方面,樹立至少兩個標桿客戶。”
  這是何國濤給普強信息定下的年底目標。離線的語音識別和語義理解,是普強信息的優(yōu)勢所在。做云端的云識別引擎,在世界市場上有谷歌、微軟、亞馬遜和蘋果這些巨頭,國內有科大訊飛和云知聲,中文的在線語音識別引擎加起來超過50家。但能實現(xiàn)中文車載嵌入式引擎加起來不超過5家。
  “如果再努力一下,我們就是第一。”
  “我們要先把中文的車載系統(tǒng)做到國內最好,然后是全世界最好!”
  何國濤坦誠地表達他對普強信息未來的期望,但橫亙在他面前的,是人才和技術的難關。“語音分析市場其實并不熱,只是最近才比較熱”。市場熱鬧起來,人才也就更加難求。
  “所以我現(xiàn)在最大任務就是穩(wěn)住這幫兄弟”,普強信息的核心團隊很穩(wěn)定,創(chuàng)立時的第一個員工現(xiàn)在還在團隊內,何國濤認為這是最值得自豪的事情之一。
  其次,要加快技術和客戶端匹配的速度。每次合作一個客戶,團隊都要花1~3個月時間對接,隨著市場的蘇醒,普強信息的客戶群體越來越大,但為了保證用戶滿意度,讓他們不敢接單。
  為解決以上問題,普強將在今年下半年引進最新的神經網絡技術,用神經網絡去自動建模,這樣將會加快用戶產品的適配速度,從而加速市場布局,也為明年年底實現(xiàn)千個客戶的市場規(guī)模做好準備。
  萬事俱備,何國濤耐心地等待著東風的到來。他把創(chuàng)業(yè)形容為彩排,“需要一個節(jié)點一個節(jié)點地去完成,如果直接跳到結局就沒意思了”。
  下一個節(jié)點,將會在三到四年之后。何國濤透露,明年年中將會進行下一輪融資,下一步,就是上市。
  “每一步都要有階段性成果,唯一的驗證就是在這個領域做到最好”。何國濤在心里計算著普強信息與行業(yè)金字塔塔尖的距離,完成超越的油門,就在他的腳下。
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題