您當前的位置是:  首頁 > 新聞 > 專家觀點 >
 首頁 > 新聞 > 專家觀點 >

神州泰岳:語義理解技術(shù)承載商業(yè)模式轉(zhuǎn)型

2017-01-06 14:57:47   作者:   來源:CTI論壇   評論:0  點擊:


  “2013年至今,大數(shù)據(jù)處于修跑道階段。”北京神州泰岳軟件股份有限公司(以下簡稱神州泰岳)副總裁楊凱程認為,大數(shù)據(jù)產(chǎn)業(yè)在這一階段的發(fā)展中還存在一些問題,如文本等非結(jié)構(gòu)化分析挖掘領(lǐng)域還缺少有效的工具。而造成這一現(xiàn)狀的癥結(jié)在于,“技術(shù)的投入和創(chuàng)新力度不夠,又缺乏現(xiàn)成的近道可走。”
神州泰岳:語義理解技術(shù)承載商業(yè)模式轉(zhuǎn)型
圖北京神州泰岳軟件股份有限公司副總裁楊凱程
  當下,業(yè)界對于大數(shù)據(jù)概念性的討論已越來越少,進入相對靜默期,部分企業(yè)開始沉下來思索大數(shù)據(jù)能做什么,亦逐漸意識到技術(shù)優(yōu)勢的重要性。
  “現(xiàn)在是大數(shù)據(jù)場景創(chuàng)新的重要階段。有幸的是,鼎富科技(神州泰岳旗下成員企業(yè))起初就意識到場景創(chuàng)新的重要性。在過去的2~3年積累了較多的場景和產(chǎn)品創(chuàng)新經(jīng)驗,已具備了很好的技術(shù)和產(chǎn)品優(yōu)勢,這是很多初創(chuàng)公司希望達到的。”楊凱程道出了鼎富科技能搶占眾人覬覦的大數(shù)據(jù)高地的關(guān)鍵所在。
  “2+2”戰(zhàn)略:推進創(chuàng)新和轉(zhuǎn)型
  人工智能和大數(shù)據(jù)是神州泰岳“2+2”全新業(yè)務(wù)格局中的重要部分。楊凱程介紹道,“6月收購鼎富科技后,公司正式推進‘2+2’發(fā)展戰(zhàn)略。第一個‘2’是指ICT運營管理和手機游戲,今年這兩項業(yè)務(wù)整體較好,構(gòu)成了當下的主要利潤;第二個‘2’是指人工智能與大數(shù)據(jù)、物聯(lián)網(wǎng)與通訊技術(shù)應(yīng)用,是泰岳未來著力打造的戰(zhàn)略業(yè)務(wù),希望通過努力,在未來三年形成四輪驅(qū)動。”
  未來,神州泰岳將把人工智能和大數(shù)據(jù)作為重要的轉(zhuǎn)型方向之一。
  楊凱程透露,神州泰岳并購鼎富科技的原因就在于公司對于大數(shù)據(jù)和人工智能領(lǐng)域未來發(fā)展前景的高度認可,而鼎富科技在非結(jié)構(gòu)化文本大數(shù)據(jù)領(lǐng)域擁有自身的核心技術(shù)。
  “因此,我們希望將自身在大數(shù)據(jù)產(chǎn)業(yè)鏈的現(xiàn)有資源和成果與鼎富科技的技術(shù)優(yōu)勢進行整合,從而,擴大神州泰岳在整個大數(shù)據(jù)產(chǎn)業(yè)鏈上的實力,并希望,未來能夠在大數(shù)據(jù)和人工智能方向上有所作為。”楊凱程道出了并購的緣由。
  為此,神州泰岳將以鼎富科技的技術(shù)為核心,對人工智能、大數(shù)據(jù)相關(guān)的業(yè)務(wù)進行整合。“在傳統(tǒng)的ICT業(yè)務(wù)中如果我們導(dǎo)入人工智能,那么人工智能在運維管理等領(lǐng)域就會產(chǎn)生一些創(chuàng)新的機會和場景,比如運維知識庫的提升、運維工單的自動分揀和幫助臺的智能機器人等。”楊凱程分析了神州泰岳在人工智能和大數(shù)據(jù)方向與現(xiàn)有業(yè)務(wù)整合后的一個可能的發(fā)展途徑。
  另外,神州泰岳子公司—神州泰岳智能數(shù)據(jù)公司和運營商合作較多,可以依托運營商的數(shù)據(jù)提供大數(shù)據(jù)的數(shù)據(jù)服務(wù),在應(yīng)用方面主要是幫助客戶做精準營銷、客戶分析和客戶畫像等業(yè)務(wù),例如向出國咨詢公司提供精準營銷。
  在“2+2”戰(zhàn)略下,神州泰岳的整體實力會得以再加砝碼,楊凱程說:“神州泰岳已積累了大量的行業(yè)客戶資源,尤其在運營商領(lǐng)域,使我們相對容易地在原有運營商的運維管理業(yè)務(wù)和其他延伸業(yè)務(wù)中疊加人工智能和大數(shù)據(jù)技術(shù),從而使原有業(yè)務(wù)得以提升和創(chuàng)新。加之現(xiàn)在運營商對人工智能、大數(shù)據(jù)已有較充分的認識和逐漸明確的需求,也使得神州泰岳有可能成為該領(lǐng)域主要的供應(yīng)商之一。”
  “不僅如此,結(jié)合鼎富科技在文本技術(shù)上的領(lǐng)先性以及原有金融行業(yè)等領(lǐng)域的先期優(yōu)勢,神州泰岳的整體實力將在整合中得以進一步加強。”楊凱程補充道。
  語義理解技術(shù)才是人工智能的關(guān)鍵
  楊凱程認為,從某種角度上看,人工智能就是大數(shù)據(jù),所以神州泰岳在往人工智能方向發(fā)展時,亦是在往大數(shù)據(jù)方向拓展。
  鼎富科技的核心技術(shù)是非結(jié)構(gòu)化文本的分析挖掘,即語義理解技術(shù),并圍繞這個方向展開非結(jié)構(gòu)化大數(shù)據(jù)業(yè)務(wù)。在該領(lǐng)域,自然語言的語義理解是人工智能認知技術(shù)的核心。IBM、微軟、BAT都在布局人工智能,而人工智能最離不開、也最具挑戰(zhàn)性的環(huán)節(jié)就是自然語言的語義理解技術(shù),因此這些公司都希望在語義理解技術(shù)上實現(xiàn)突破。
  目前,深度學(xué)習(xí)的出現(xiàn)使得自然語言處理領(lǐng)域在傳統(tǒng)的規(guī)則方法和統(tǒng)計方法之外,有了更為領(lǐng)先的技術(shù)手段。
  應(yīng)該說深度學(xué)習(xí)的出現(xiàn),有效地促進了語音識別、圖像識別等領(lǐng)域的快速發(fā)展,使其可用性達到了可廣泛應(yīng)用的條件,但是在自然語言語義理解領(lǐng)域通過深度學(xué)習(xí)來達到與語音識別等類似的效果,目前看還比較困難,尤其是中文的語義理解。
  眾所周知,深度學(xué)習(xí)和統(tǒng)計方法都需要語料學(xué)習(xí),高質(zhì)量的數(shù)量龐大的語料就變得極為重要,這也是深度學(xué)習(xí)在自然語言語義理解方面所面臨的挑戰(zhàn)。
  而在行業(yè)領(lǐng)域,積累和準備可供學(xué)習(xí)的語料這項工作仍較繁重,而且需要時間積累,但好的方面是行業(yè)領(lǐng)域具有邊界,所以在某些行業(yè)領(lǐng)域中如果樣本數(shù)據(jù)豐富或者易于積累的情況下,或者在特定的功能范圍內(nèi),深度學(xué)習(xí)是會有較好效果的。
  “目前,我們在自然語言的語義理解方面,處于一個相對領(lǐng)先地位。鼎富科技自2011年成立就一直在研發(fā)基于概念計算、能夠解決中文歧義性和支持多語種的‘智慧語義認知技術(shù)’。該技術(shù)不同于深度學(xué)習(xí)和統(tǒng)計方法,不需要學(xué)習(xí)大量語料,這是不同公司在底層的自然語言語義理解技術(shù)的差異。”楊凱程解釋道。
  “我們對非結(jié)構(gòu)化文本大數(shù)據(jù)行業(yè)的另一貢獻是,研發(fā)了DINFO-OEC非結(jié)構(gòu)化大數(shù)據(jù)的分析挖掘平臺。它是完全面向業(yè)務(wù)建模的,讓研發(fā)人員將注意力放在業(yè)務(wù)理解和業(yè)務(wù)表達上,而將鼎富科技的智慧語義認知技術(shù)進行了封裝,因此極大地縮短了行業(yè)應(yīng)用場景創(chuàng)新的研發(fā)周期和提高了應(yīng)用質(zhì)量。”在楊凱程看來,DINFOOEC平臺還存在不斷完善的要求,但它的出現(xiàn)推動了行業(yè)在文本處理技術(shù)的應(yīng)用,促使大家開發(fā)應(yīng)用時專注于業(yè)務(wù)的大數(shù)據(jù)創(chuàng)新,而不是成為語義技術(shù)和文本技術(shù)的困獸。
  “近幾年,DINFO-OEC平臺推出后在工行、中行、順豐、軍工、政府中都得到很好的應(yīng)用。2014年,中國工商銀行呼叫中心的客服工單分析挖掘系統(tǒng)、順豐的呼叫中心工單智能分檢系統(tǒng)都上線了。其中智能分類的準確率達到95%以上,并支持多語種,這在國際上也是遙遙領(lǐng)先。”楊凱程介紹。
  “大數(shù)據(jù)時代,不能紙上談兵,而是要扎扎實實地結(jié)合行業(yè)進行場景的創(chuàng)新。”楊凱程認為,埋頭苦干、真有創(chuàng)新遠比空有噱頭來的重要。
  三大戰(zhàn)略助推大數(shù)據(jù)優(yōu)勢
  依托在自然語言的語義理解上的技術(shù)領(lǐng)先優(yōu)勢,神州泰岳大數(shù)據(jù)戰(zhàn)略主要分為三個層面:
  • 戰(zhàn)略一:語義云
  楊凱程認為,推出泰岳語義云目的是因為自然語言語義理解技術(shù)的投入是十分巨大的,需要的技術(shù)研發(fā)時間也是長期的,而大數(shù)據(jù)和人工智能的發(fā)展離不開自然語言語義技術(shù)的應(yīng)用,各行各業(yè)的大數(shù)據(jù)和人工智能創(chuàng)新除了技術(shù)創(chuàng)新的同時,也離不開業(yè)務(wù)場景的創(chuàng)新。
  只有整合行業(yè)背景資源和語義技術(shù)資源才可能做好這件事,所以神州泰岳希望通過泰岳語義云的推出,將自然語言語義技術(shù)開發(fā)給市場,開發(fā)給合作伙伴和行業(yè)客戶,大家一起共同推動行業(yè)大數(shù)據(jù)和人工智能應(yīng)用的發(fā)展,當然也希望有更多志同道合的同仁一起,圍繞泰岳語義云建設(shè)一個領(lǐng)先的自然語言語義處理的生態(tài)圈。
  眾所周知,大數(shù)據(jù)尤其是非結(jié)構(gòu)化大數(shù)據(jù)的分析挖掘,需要的投入和技術(shù)準入門檻很高,神州泰岳不可能覆蓋各行業(yè)的業(yè)務(wù)或創(chuàng)新。但現(xiàn)在社會化數(shù)據(jù)80%都是非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)的文本數(shù)據(jù)在各行各業(yè)有大量需求。
  “就此,我們希望通過語義云的方式,將非結(jié)構(gòu)化數(shù)據(jù)的技術(shù)和人力向社會開放,也希望客戶和合作伙伴能通過使用這種能力,再結(jié)合自身對行業(yè)的創(chuàng)新理解和行業(yè)的背景、經(jīng)驗,在行業(yè)中不斷創(chuàng)新,從而共同推動非結(jié)構(gòu)化大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。”楊凱程如是說。
  “我們現(xiàn)在雖未理清語義云開源的政策和策略,我們也還在學(xué)習(xí)中,但這是個方向。我們也希望集合更多的資源,共同推動語義云的創(chuàng)新。同時,我們也希望通過語義云的方式給神州泰岳帶來新的業(yè)務(wù)盈利模式。”為此,楊凱程表示,目前神州泰岳也已成立了神州泰岳人工智能研究院,研究院匯聚了鼎富科技的核心技術(shù)力量,以持續(xù)推動自身在自然語言的語義理解技術(shù)上的領(lǐng)先性。
  • 戰(zhàn)略二:人工智能
  人工智能的核心是認知,而認知的核心是語義理解技術(shù)。我們依托領(lǐng)先的語義技術(shù),重點推出了兩款人工智能產(chǎn)品—統(tǒng)一業(yè)務(wù)知識庫和小富機器人。楊凱程指出,“現(xiàn)在的機器人還不能完全實現(xiàn)自然的交流,而未來機器人應(yīng)該跟人溝通、交流時更像人,所以我們希望小富機器人能夠推動機器人在認知領(lǐng)域的進一步發(fā)展。”
  知識庫也是人工智能的重要環(huán)節(jié),F(xiàn)在知識庫的加工基本是人工的參與為主,由人工進行知識的加工、入庫,這會給知識庫的應(yīng)用領(lǐng)域帶來大量的困擾和挑戰(zhàn)。
  “我們希望能夠生產(chǎn)出新一代的知識庫系統(tǒng),可以支持加工智能化,為行業(yè)帶來巨大的改變。”楊凱程如是說。
  • 戰(zhàn)略三:云服務(wù)
  云服務(wù)戰(zhàn)略是神州泰岳希望服務(wù)好行業(yè)客戶的戰(zhàn)略,同時也是希望未來更多地采用SaaS服務(wù)的方式提供云服務(wù),將服務(wù)對象向中小企業(yè)甚至個人傾斜的戰(zhàn)略。行業(yè)客戶具有較多的差異性,在一段時間內(nèi),服務(wù)行業(yè)的商業(yè)模式可能是多種模式的混搭,不排除傳統(tǒng)的解決方案交付方式,但是我們會盡可能尋找服務(wù)模式的機會和機遇,甚至在時機恰當?shù)臅r候引導(dǎo)客戶選擇服務(wù)模式。
  從目前來看,行業(yè)的大數(shù)據(jù)和人工智能機遇已經(jīng)來臨,關(guān)鍵問題是,如何選擇機遇和如何落實落地的問題。
  “工欲善其事,必先利其器”,對于神州泰岳來說,優(yōu)勢在于“器”已經(jīng)在手中了。楊凱程表示,“我們根據(jù)不同行業(yè)對文本技術(shù)的依賴度選擇行業(yè)。對文本技術(shù)依賴度很強,或文本是其重要業(yè)務(wù)的行業(yè),如媒體、證券等行業(yè)將重點開拓。”
  對于文本的堅守與期待
  要擁有國際影響力,核心競爭力是關(guān)鍵。就此,楊凱程認為,神州泰岳人工智能和大數(shù)據(jù)業(yè)務(wù)的核心競爭力就是自然語言語義理解技術(shù)的領(lǐng)先,尤其是對中文的分析處理能力。
神州泰岳:語義理解技術(shù)承載商業(yè)模式轉(zhuǎn)型
  楊凱程認為,“從某種角度上說,掌握中文語義理解技術(shù)對于中國人來說是一次重要機遇,不論是鼎富科技突破還是其它國內(nèi)的友商突破都是值得慶賀的事情。長期以來與國外的IT巨頭相比,中國非常缺乏領(lǐng)先的IT技術(shù)領(lǐng)域,而‘中華民族是以漢字為記的偉大民族’,中文是我們祖先留下的最為寶貴的財富,而中文自身的歧義性等難于攻克的難題,也使得國外IT巨頭難于短時間突破,如果我們能夠領(lǐng)先,就能夠?qū)⒅形牡奶幚砟芰α粼谥袊耸种。泰岳人希望看到這樣的情況,不希望喪失這個可以領(lǐng)先的機遇。”
  因此,我們成立了神州泰岳人工智能研究院,使鼎富科技的技術(shù)人員可以專注地研究自然語言語義技術(shù)和人工智能的產(chǎn)品,由集團的其它分子公司來落實行業(yè)的應(yīng)用創(chuàng)新和市場營銷。
  “當我們擁有很強的中文處理能力同時又具有完全自主知識產(chǎn)權(quán)的時候,就為神州泰岳服務(wù)于軍隊、安全和公安等部門創(chuàng)造了機遇。例如我們在軍工行業(yè)做了一個類似于情報系統(tǒng)的知識庫,目前已經(jīng)同時支持12個主要國家的語言,且其知識處理能力具有較好的領(lǐng)先性。再比如在公安刑偵文本分析挖掘中,對作案手段、時間、地點、物品、當事人和嫌疑人等信息的抽取水平的準確率和召回率都達到了90%以上,而這一技術(shù)能力通過優(yōu)化是完全可以達到98%以上的,這將對提升刑事案件偵破的效率、線索的發(fā)現(xiàn)等提供極大的幫助。”楊凱程表示。
  楊凱程認為,在未來大數(shù)據(jù)創(chuàng)新中,國內(nèi)大數(shù)據(jù)企業(yè)還是具有很大優(yōu)勢的。“因為大數(shù)據(jù)的屬性是本地化,和生活、工作具有較強的相關(guān)性。而國外企業(yè)在國內(nèi)數(shù)據(jù)方面的獲取應(yīng)該還是有一定挑戰(zhàn)的,這也給國內(nèi)企業(yè)提供了競爭的便利。”
  其次,應(yīng)用產(chǎn)品的優(yōu)勢明顯。“正是數(shù)據(jù)的本地化制約和對于國內(nèi)行業(yè)的理解,我們在產(chǎn)品創(chuàng)新上依然具有優(yōu)勢。我們與國外在工具的研發(fā)等技術(shù)領(lǐng)域確實有差距,所以我們希望在中文這個細分領(lǐng)域,做得比國外更強。”楊凱程道出了產(chǎn)品的優(yōu)勢和未來的戰(zhàn)略所在。
  優(yōu)勢和困境總是如影隨形。大數(shù)據(jù)面臨的難題就是需要大量而持續(xù)地投入。“鼎富科技在開始的幾年中,將70~80%的資金都投入了研發(fā),雖然保持了每年接近300%的收入增長,但還是不一定能夠完全滿足研發(fā)投入的要求。而大數(shù)據(jù)和人工智能的發(fā)展極其迅速,IT和互聯(lián)網(wǎng)巨頭們紛紛加入,若沒有及時把握,就可能喪失機會,我們不希望喪失機會,所以才與神州泰岳進行整合。”楊凱程道出了發(fā)展大數(shù)據(jù)的困局和堅守之難。
  文本技術(shù)需要承載公司未來商業(yè)模式的轉(zhuǎn)型。但楊凱程認為,在這個過程中,需要有所為、有所不為。相信有這份有所為、有所不為的魄力,神州泰岳將在人工智能和大數(shù)據(jù)領(lǐng)域開拓出一片新天地。

專題