您當(dāng)前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

捷通華聲:在內(nèi)生與外延中助力“賦能百業(yè),共享AI未來”

2022-03-16 14:01:20   作者:白華   來源:互聯(lián)網(wǎng)周刊   評論:0  點擊:


  人工智能是中國為數(shù)不多的與世界同步發(fā)展的技術(shù)領(lǐng)域,經(jīng)過數(shù)十年國內(nèi)無數(shù)優(yōu)秀科學(xué)家、學(xué)者、以及眾多企業(yè)研發(fā)工程師的不懈努力,我國部分領(lǐng)域核心關(guān)鍵技術(shù)實現(xiàn)重要突破,語音識別、視覺識別技術(shù)世界領(lǐng)先。
  這一次產(chǎn)業(yè)界和學(xué)術(shù)界深度融合,發(fā)揮了更廣泛作用,在捷通華聲等專注核心技術(shù)研發(fā)和產(chǎn)業(yè)化應(yīng)用的企業(yè)共同努力下,守住了智能語音核心技術(shù)在國際競爭中的主動權(quán),中國語音合成產(chǎn)業(yè)市場牢牢掌握在我們的民族企業(yè)手上。
  2000年10月,本著“讓機(jī)器‘能說會聽,能寫會看,能辨音會認(rèn)人,能思考會判斷’,為人們的生活帶來輕松與便捷”的美好愿望,捷通華聲成立,并提出了力爭成為國際一流的智能語音技術(shù)和智能人機(jī)交互解決方案提供商的戰(zhàn)略目標(biāo),是國內(nèi)最早投入人工智能領(lǐng)域的創(chuàng)業(yè)團(tuán)隊之一。
  低調(diào)研發(fā)與積極開放,走過十年磨一劍的歷程
  在人工智能的道路上,由最開始人工智能概念的普及,到深度學(xué)習(xí)掀起新一輪浪潮,到科技戰(zhàn)疫、復(fù)工復(fù)產(chǎn),再到作為新基建七大領(lǐng)域之一被寫入政府工作報告,捷通華聲作為業(yè)內(nèi)少有的具有“時代感”的一家企業(yè),每個環(huán)節(jié)都有參與,有些環(huán)節(jié)更是作為推動者在做。
  自21世紀(jì)開始,捷通華聲在國內(nèi)語音市場的占有率一直保持在20%左右,超過國際巨頭IBM、摩托羅拉等,二十年來,公司專注于把人工智能技術(shù)做出“中國水準(zhǔn)”。2011年,基于深度神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型在大詞匯量連續(xù)語音識別任務(wù)上獲得了顯著的性能提升,智能語音領(lǐng)域研究開始轉(zhuǎn)向深度學(xué)習(xí)。這一年,捷通華聲對外發(fā)布靈云(AICloud.com)平臺,將語音識別、語音合成、語義理解、機(jī)器翻譯、圖像識別等智能語音、智能語義、智能視覺技術(shù)面向產(chǎn)業(yè)全面開放。按照公司理念,人工智能包含一整套技術(shù),相互之間有很強(qiáng)的關(guān)聯(lián)性,且在很多場景下都需要同時使用,因此,不同于其他專注單一技術(shù)的AI公司,捷通華聲致力于做全方位的人工智能。
  作為新一代信息技術(shù),人工智能經(jīng)歷了長期的技術(shù)磨合和概念炒作期。期間,捷通華聲一直專注于低調(diào)研發(fā),如果不是特意去了解,大眾可能很難知曉在馳騁的高鐵上,在2008年北京奧運(yùn)會、上海世博會以及新近建成的大興機(jī)場等眾多應(yīng)用場景中,都采用了捷通華聲的語音合成技術(shù)。如今,經(jīng)過多年技術(shù)的更新迭代,聲音在更逼真的同時擁有不同音色和不同風(fēng)格,還基于混合語種的算法研究與數(shù)據(jù)積累,填補(bǔ)國內(nèi)智能客服領(lǐng)域關(guān)于多國語言、多民族語言、多方言混合語種識別的國內(nèi)應(yīng)用空白。
  從公司初創(chuàng)到2011年,捷通華聲經(jīng)歷的是探索與積累的過程,之后進(jìn)入發(fā)展階段。隨著產(chǎn)學(xué)研用體系的完整構(gòu)建及資金的注入,捷通華聲本著對核心技術(shù)孜孜不倦的探索精神和務(wù)實推進(jìn)的原則,從低調(diào)研發(fā)走向積極開放,在不斷摸索中走出了自己的道路。即以自主研發(fā)的人工智能算法為核心,以市場應(yīng)用為導(dǎo)向,推進(jìn)智能語音、智能語義等技術(shù)研發(fā)持續(xù)創(chuàng)新與融合,形成由技術(shù)到平臺、由產(chǎn)品到解決方案全覆蓋的產(chǎn)業(yè)生態(tài),全面融入經(jīng)濟(jì)社會發(fā)展。
  能力、應(yīng)用及場景的融合是AI發(fā)展趨勢
  人工智能是一個由淺入深的智能化過程,淺層上是智能化的人機(jī)交互方式,而深層次上則是基于機(jī)器學(xué)習(xí)技術(shù)的知識表達(dá)、歸納、推理等智能計算過程。如果說智能人機(jī)交互是人工智能的觸角,那么智能計算則是其核心。依靠深厚的技術(shù)底蘊(yùn)和產(chǎn)業(yè)市場的拓展,靈云平臺已經(jīng)成為構(gòu)建了集合數(shù)十項核心技術(shù)的全方位人工智能開放平臺,主要覆蓋智能語音、智能語義、智能視覺和大數(shù)據(jù)分析四個層面,并構(gòu)建了包括技術(shù)、平臺和行業(yè)解決方案的產(chǎn)品生態(tài)體系。
  在信息技術(shù)創(chuàng)新與應(yīng)用上,捷通華聲則積極響應(yīng)關(guān)鍵技術(shù)國產(chǎn)化戰(zhàn)略,堅持自主創(chuàng)新。目前已實現(xiàn)與鯤鵬、飛騰、龍芯、兆芯處理器,銀河麒麟、中標(biāo)麒麟、UOS統(tǒng)信操作系統(tǒng),以及高斯、達(dá)夢數(shù)據(jù)庫等中間件的兼容性互認(rèn)證,形成多元異構(gòu)的信創(chuàng)產(chǎn)品生態(tài),推動人工智能技術(shù)與實體經(jīng)濟(jì)的深度融合,有望在國家自主可控的發(fā)展浪潮下持續(xù)受益。
  近年來隨著我國人工智能技術(shù)和產(chǎn)業(yè)的迅猛發(fā)展,實體經(jīng)濟(jì)智能化成為客觀發(fā)展的必然結(jié)果。利用人工智能解決各行業(yè)痛點問題、提升生產(chǎn)效率,是驅(qū)動其商業(yè)化落地的根本動力,在多個應(yīng)用場景中,AI的廣泛應(yīng)用提高行業(yè)精準(zhǔn)化服務(wù)水平,也提升了人們的生活品質(zhì)。
  隨著產(chǎn)業(yè)整體步入成熟化發(fā)展的新階段,部分通用化、淺層化的人工智能產(chǎn)品和服務(wù)難以較好地滿足各行業(yè)日益垂直化、專業(yè)化、場景化、細(xì)分化的賦能需求。人工智能產(chǎn)業(yè)的發(fā)展需要從場景出發(fā),深入挖掘業(yè)務(wù),將多項AI能力進(jìn)行整合,形成智能化解決方案。捷通華聲靈云平臺通過與不同行業(yè)業(yè)務(wù)系統(tǒng)的快速對接,實現(xiàn)AI與細(xì)分場景深度結(jié)合。并在尋求底層技術(shù)突破的同時,進(jìn)行更加契合客戶需求的產(chǎn)品化開發(fā),針對客戶的特殊需求,推出了不同形態(tài)的應(yīng)用和解決方案,實現(xiàn)在技術(shù)層、平臺層和應(yīng)用層的全產(chǎn)業(yè)鏈布局。
  “每個行業(yè)都有自己的問題要解決,有應(yīng)用場景要突破,需要技術(shù)跟場景的深度融合,這些需求已經(jīng)不是單一的AI能力所能滿足的。人工智能企業(yè)需要具備一定的技術(shù)沉淀以及行業(yè)理解,進(jìn)行能力融合、應(yīng)用融合和場景融合。只有實現(xiàn)行業(yè)的垂直縱深,技術(shù)才能擁有更大的落地價值”。捷通華聲董事長兼總經(jīng)理武衛(wèi)東在采訪中如是說。
  場景決定應(yīng)用,應(yīng)用決定市場,市場決定企業(yè)發(fā)展前景
  只有企業(yè)與用戶不斷交流,才能夠了解用戶的訴求,人工智能發(fā)展的動能才會有跡可循。AI的本質(zhì)是科技進(jìn)步對所有產(chǎn)業(yè)的提升,只有AI實現(xiàn)與各傳統(tǒng)產(chǎn)業(yè)融合應(yīng)用,才能創(chuàng)造出持續(xù)的經(jīng)濟(jì)價值和社會價值,反過來,持續(xù)向好的經(jīng)濟(jì)也會反哺人工智能企業(yè)的成長。
  公司的發(fā)展目標(biāo)除高瞻遠(yuǎn)矚的先見外,還需要實際需求的推動。武衛(wèi)東在采訪中提到,公司要做全方位的人工智能,在產(chǎn)品落地過程中的實際應(yīng)用場景也是原因之一。技術(shù)積累對創(chuàng)新型產(chǎn)業(yè)來說是一個漫長的過程,而短期內(nèi)AI服務(wù)商很難將技術(shù)直接轉(zhuǎn)化落地應(yīng)用,缺乏造血機(jī)能。如今的政策導(dǎo)向和市場環(huán)境使得很多頭部企業(yè)和初創(chuàng)企業(yè)涌入人工智能賽道,但實際擁有核心技術(shù)的企業(yè)并不多,原因之一就是除了算法算力等硬技術(shù),還需要數(shù)據(jù)及場景等關(guān)鍵要素的支持,而這,正是長期積累才能夠獲得的獨家資源。例如語音識別的通用模型很容易復(fù)制,但一旦深入至B端企業(yè)及細(xì)分行業(yè)場景,單數(shù)據(jù)加工處理就需要做很多工作。因此,沒有深耕行業(yè)的決心和韌性的企業(yè)無法做到長期發(fā)展。
  經(jīng)過多年的實戰(zhàn)積累,捷通華聲不僅在核心技術(shù)上勢頭猛進(jìn),同時對人工智能的場景化應(yīng)用經(jīng)驗頗豐。例如靈云全方位人工智能能力平臺AICP采用開放性架構(gòu)設(shè)計,集成商或客戶可以靈活挑選、組合應(yīng)用各項捷通華聲研發(fā)的人工智能技術(shù),打造符合自身需求的智能化業(yè)務(wù)應(yīng)用。而靈云AICC全智能客服解決方案則在各地進(jìn)行數(shù)字政府建設(shè)過程中,有力支撐了政務(wù)服務(wù)便民熱線智能化升級。同時,捷通華聲的技術(shù)提供形式也在由之前單獨的授權(quán),向公有云、私有云解決方案轉(zhuǎn)變。以智能客服為例,如果客戶不想搭服務(wù)器,公司可提供公有云服務(wù),如果客戶要求數(shù)據(jù)保密,則有私有云服務(wù)。換言之,公司可以在能力基礎(chǔ)上提供定制化方案服務(wù)。
  目前,捷通華聲為黨政、金融、能源、社區(qū)、電信、交通等各行業(yè)和領(lǐng)域提供了眾多智能化解決方案和服務(wù)。公司在內(nèi)生式增長與外延式擴(kuò)張中不斷豐富核心技術(shù),完善產(chǎn)品生態(tài),推動產(chǎn)業(yè)智能化升級。
  普惠、便利是技術(shù)價值所向
  顯而易見,人工智能是未來社會的趨勢,但與大多數(shù)人的想象不一樣,它是以一種潤物細(xì)無聲的方式深入到大眾生活的方方面面,而AI的最終落點也在于是否能普惠民眾、便利生活。
  在新冠疫情常態(tài)化防控中,捷通華聲發(fā)揮了重要作用。人工智能技術(shù)的應(yīng)用,能夠在有效解決人力緊缺問題的同時,降低人與人接觸概率,實現(xiàn)群眾全覆蓋、無死角、無盲區(qū)的地毯式專項防控,保證信息暢通與實時共享,使相關(guān)部門及時掌握事件相關(guān)信息,快速做出正確決策,從而掌握防疫主動權(quán)。智能12345政務(wù)服務(wù)便民熱線能夠迅速轉(zhuǎn)換工作場景,通過外呼機(jī)器人進(jìn)行批量重點人群篩查、疫情防控和宣教工作,對轄區(qū)內(nèi)人員進(jìn)行是否外出、人員接觸、身體狀況等方面的電話問詢,并根據(jù)交互式問答,主動進(jìn)行研判,形成調(diào)查報告,使得疫情防控效率大幅提升,極大減輕了基層社區(qū)人員的工作負(fù)擔(dān)和健康風(fēng)險。
  在金融服務(wù)行業(yè)的賦能轉(zhuǎn)型上,武衛(wèi)東認(rèn)為需要以人工智能為支撐的服務(wù)體系、風(fēng)控體系、運(yùn)營體系,通過多種新興技術(shù)的交叉運(yùn)用,在人機(jī)交互方式、數(shù)字化業(yè)務(wù)方面不斷革新,重構(gòu)金融用戶的消費(fèi)習(xí)慣,構(gòu)建新的核心競爭力。因此,捷通華聲結(jié)合多年智能化升級經(jīng)驗,推出了覆蓋客戶服務(wù)、手機(jī)銀行、營銷決策、風(fēng)險防控、網(wǎng)點智能化等多重場景的行業(yè)解決方案。其中針對某銀行信用卡中心搭建的靈云智能客服和綜合業(yè)務(wù)外呼組合項目不僅大幅降低業(yè)務(wù)支出,而且為服務(wù)對象帶來了實實在在的便利。
  據(jù)介紹,公司在AIoT智能物聯(lián)網(wǎng)方面已為華為盒子、智能電視、導(dǎo)航、車載輸入法等提供眾多解決方案。除此之外也推出了自己的C端產(chǎn)品“靈云聽語”“智能錄音筆”,支持實時將聲音轉(zhuǎn)為文字和離線音頻轉(zhuǎn)寫,目前處在一個快速發(fā)展階段。“讓每個企業(yè)都擁有人工智能,讓每個人都能享受到人工智能的輕松和便捷”正在步步落地為實。
  人工智能是一場沒有終點的長跑
  基于深度學(xué)習(xí)的AI技術(shù)取得了卓越的效果,伴隨而來的則是“大”數(shù)據(jù)、“大”模型,數(shù)據(jù)動輒TB量級,模型參數(shù)更是達(dá)到千億級別,在如今摩爾定律日漸失效、數(shù)據(jù)監(jiān)管收緊的背景下,作為在此領(lǐng)域深耕的一家企業(yè),捷通華聲還有很多的工作要做。針對深度學(xué)習(xí)訓(xùn)練過程中所需的大量人工標(biāo)注的數(shù)據(jù),公司目前主要通過數(shù)據(jù)仿真、數(shù)據(jù)增廣、無監(jiān)督訓(xùn)練、多任務(wù)等方式進(jìn)行改進(jìn),實現(xiàn)由“大”數(shù)據(jù)到“小”數(shù)據(jù)。同時,學(xué)術(shù)界和產(chǎn)業(yè)界則通過模型裁剪、張量分解、研發(fā)專用芯片等方式解決“大”模型的困擾。說到底,人工智能是一場長跑,而做研究則是這場競賽的關(guān)鍵。
  目前國內(nèi)外的一些基礎(chǔ)性研究,尤其是方法理論性研究主要來源于大學(xué),捷通華聲不僅獲得了清華產(chǎn)業(yè)基金投資,同時共同創(chuàng)立靈云人工智能研究中心、清華海峽院人工智能研究中心,通過與清華大學(xué)各院系教授團(tuán)隊合作,持續(xù)強(qiáng)化基礎(chǔ)理論研究,促進(jìn)關(guān)鍵技術(shù)成果轉(zhuǎn)化,從而真正推動“賦能百業(yè),共享AI未來”愿景的實現(xiàn)。
  談及人工智能行業(yè)經(jīng)歷的數(shù)次資本炒作與退潮,武衛(wèi)東認(rèn)為2021年資本對于人工智能領(lǐng)域依舊保持很高的熱情,因為AI行業(yè)完全契合國家戰(zhàn)略發(fā)展方向,是國家重點鼓勵和支撐的產(chǎn)業(yè)。但由于很多企業(yè)前期投入巨大,虧損嚴(yán)重,估值虛高,所以也在一定程度上困擾了投資人。因此,投資機(jī)構(gòu)將更傾向于以創(chuàng)新能力和技術(shù)儲備、穩(wěn)定的業(yè)務(wù)、合理的估值、可期的發(fā)展前景等幾大維度進(jìn)行選擇和決策。目前,捷通華聲也在不斷發(fā)展的基礎(chǔ)上進(jìn)行常態(tài)化融資,并積極籌備IPO。
  2020年,捷通華聲成功上榜北京市“專精特新”小巨人首批名單。2021年,多家機(jī)構(gòu)入股捷通華聲,在產(chǎn)業(yè)層面對公司賦能。一直以來,公司堅持聚焦行業(yè)深耕戰(zhàn)略,將全方位人工智能技術(shù)應(yīng)用于多行業(yè)、多場景,并在細(xì)分場景下不斷完善業(yè)務(wù)積累。管理學(xué)家吉姆·柯林斯將平庸的企業(yè)比作狐貍,因為他們隨波逐流跟風(fēng)取巧,而卓越的企業(yè),往往具備刺猬般的專注,F(xiàn)在回頭看看,多項技術(shù)融合應(yīng)用正是AI與各行各業(yè)交叉融合,實現(xiàn)產(chǎn)業(yè)智能化升級的基礎(chǔ),而這也是新基建的特性之一。
  武衛(wèi)東直言,在人工智能領(lǐng)域,我們和世界發(fā)達(dá)國家仍存在一定的技術(shù)差距。堅持自主研發(fā),全面增強(qiáng)原始創(chuàng)新能力,在新一輪國際科技競爭中掌握主導(dǎo)權(quán),是中國所有科技創(chuàng)新者,包括捷通華聲的價值追求,也是責(zé)任。智能應(yīng)用成為互聯(lián)網(wǎng)下一演進(jìn)階段周期的核心要義,人工智能部分技術(shù)已經(jīng)進(jìn)入產(chǎn)業(yè)化發(fā)展階段,帶來新的產(chǎn)業(yè)興起。
  “我有兩個愿望,一個是看到我們國家科技進(jìn)步,更加強(qiáng)大。另一個就是盡捷通華聲最大的能力,推動中國人工智能產(chǎn)業(yè)的發(fā)展,為經(jīng)濟(jì)社會發(fā)展貢獻(xiàn)一份力量。”采訪的最后,這位公司領(lǐng)導(dǎo)人這樣說道。
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)