首頁>>廠商>>語音識別與合成>>得意音通

得意口語對話系統(tǒng)開發(fā)包與得意智能互動信息服務

2004/11/18

目錄

1. 什么是得意口語對話系統(tǒng)開發(fā)包?
2. 得意口語對話系統(tǒng)開發(fā)包的突出優(yōu)點是什么?
3.什么是得意口語對話系統(tǒng)開發(fā)包精簡版
4.什么是得意智能互動信息服務?
5.得意智能互動信息服務的重大創(chuàng)新
6. 得意智能互動信息服務的重大優(yōu)越性
7. 得意口語對話系統(tǒng)的處理能力如何?
8.得意智能互動信息服務在短信和WAP上的應用
9. 得意智能互動信息服務在智能聊天機器人的應用
10. 得意智能互動搜索在"商業(yè)黃頁"、"電子商務"的應用
11.與一般的"智能"、"互動"系統(tǒng)相比有什么區(qū)別和優(yōu)越性?
附:得意公司與TOM.com合作提供的WAP智能搜索服務

1. 什么是得意口語對話系統(tǒng)開發(fā)包?
  得意公司采用最先進的自然語言理解技術、對話管理技術和系統(tǒng)集成技術,獨立開發(fā)了具完全自主知識產權的"得意口語對話系統(tǒng)開發(fā)包" (d-Ear SDS SDK)。這個開發(fā)包具備集成、可視化的、面向領域等重要技術特點,是目前世界上第一個,也是唯一的實用漢語口語對話系統(tǒng)開發(fā)包,為智能信息服務提供了易用、實用、好用的技術手段和運營平臺。

  與其他中文自然語言理解系統(tǒng)不同,得意的系統(tǒng)支持的是靈活隨意的口語對話,并能根據(jù)對語義的真正理解,采用先進的自然語言生成技術,產生自然的應答語句。一個口語對話系統(tǒng)包括的主要部分有:語義分析器、對話管理器、應答生成器等。得意公司在這幾個方面都做得很好,軟件開發(fā)工具包和開發(fā)環(huán)境完備,對技術開發(fā)人員要求不高,利用該開發(fā)工具,可以大大縮短開發(fā)周期,快速并有效地開發(fā)出實用的口語對話系統(tǒng)。國內大部分的技術開發(fā)商和SP都能輕松應用此開發(fā)工具開發(fā)自己的智能服務系統(tǒng),有關的修改、補充和維護工作也很方便,一般通過修改配置文件就可以達到對系統(tǒng)進行升級的目的。


2. 得意口語對話系統(tǒng)開發(fā)包的突出優(yōu)點是什么?

  目前國內并沒有對話系統(tǒng)的開發(fā)工具包。與國外其它機構擁有的對話系統(tǒng)開發(fā)工具包相比,"得意口語對話系統(tǒng)"有以下重要的優(yōu)點:

  (1) 實用化。國外的開發(fā)工具包絕大多數(shù)只用于實驗室研究,并不涉及實用化時必須面臨的非核心技術上的問題。得意的系統(tǒng)已經得到實際應用。
  (2) 語言理解。漢語口語與國外語言(特別是英語類語言)相比有較大不同之處,處理起來更加困難。得意的系統(tǒng)是目前唯一針對漢語口語理解的對話系統(tǒng)開發(fā)工具。
  (3) 對話管理。國外的絕大多數(shù)開發(fā)工具只適用于簡單的菜單式對話管理技術,即系統(tǒng)事先定義好對話流程,用戶必須跟著系統(tǒng)的提示進行對話。而得意的系統(tǒng)實現(xiàn)的基于主題森林的對話管理,使得熟練用戶可以自主地與系統(tǒng)進行交互,減少不必要的對話回合;當用戶在對話過程中遇到困難時,系統(tǒng)會主動引導對話進行。
  (4) 對話系統(tǒng)框架。與國外開發(fā)工具包相比,由于采用了不同的自然語言理解技術和對話管理技術,得意對話系統(tǒng)框架要復雜得多,特別是直接支持多路并發(fā)的對話。
  (5) 開發(fā)環(huán)境。得意系統(tǒng)的開發(fā)環(huán)境提供了工程管理功能,并且集成了對話系統(tǒng)各模塊相關的多個開發(fā)工具。國外現(xiàn)有的一些自然語言處理或對話系統(tǒng)的開發(fā)環(huán)境,都只集成了部分工具。

  類似于歌曲下載、航班信息查詢等中型規(guī)模的口語對話系統(tǒng),從規(guī)則定義、技術開發(fā)到實際上線應用,只需1個月左右;系統(tǒng)應答正確率可達90%以上;經過兩至三月的實際運行和改進(例如根據(jù)實測情況適當增加一些關鍵詞匯和語義解釋規(guī)則),系統(tǒng)應答正確率可迅速提高到98%以上。

3.什么是得意口語對話系統(tǒng)開發(fā)包精簡版

  "得意"口語對話系統(tǒng)開發(fā)包精簡版(d-Ear SDS Lite)是d-Ear SDS SDK系列產品之一,它保持了d-Ear SDS SDK標準版本中強大的語義分析功能,而減少了其中的對話管理功能,這些功能在簡單的文本應用中并不需要。此產品依然具有出色的性能:
4.什么是得意智能互動信息服務?

  利用 "得意口語對話系統(tǒng)軟件開發(fā)工具包",技術開發(fā)商和SP等能夠快速地建立提供支持漢語口語對話的智能互動信息服務系統(tǒng)。所建立的智能互動系統(tǒng)可智能地參與和完成不同領域復雜的對話任務,而且支持并發(fā)的多路對話。

  "得意"智能互動信息服務,是對用戶輸入的文本進行自動分析和理解,再從知識庫中提取用戶所需的信息,然后自動產生智能應答語句,并以文本的形式通過電腦或者手機發(fā)回用戶。由于"得意"口語對話系統(tǒng)具有上下文相關理解和人機混合主導等強大功能,在指定的領域內,用戶可通過一次或者多次輸入(包括詞語、句子)構成一組對話,完成復雜的信息查詢或者其他互動信息服務。

  "得意"智能互動信息服務系統(tǒng)首先對用戶提出的問題進行斷詞、斷句,然后根據(jù)系統(tǒng)預先設置的語義規(guī)則理解整句話的意思,形成相應的查詢條件,在現(xiàn)有數(shù)據(jù)庫進行快速而準確查詢,給出用戶需要的答案或者提示用戶進一步輸入有關的信息。

  在與用戶對話的過程中,"得意"智能互動系統(tǒng)不僅可以處理用戶不同的表達方式,而且可以根據(jù)對話場景和對話上下文智能地理解用戶語義;當用戶在對話過程中遇到困難時,系統(tǒng)還會主動引導用戶獲取想要的信息,實現(xiàn)真正的"智能"與"互動"功能。

5.得意智能互動信息服務的重大創(chuàng)新

  在現(xiàn)有的數(shù)據(jù)通信和信息服務的技術平臺上,加入"得意口語對話系統(tǒng)運行平臺",就能夠讓用戶在通過Internet/SMS/WAP等各種通信手段,在電腦、手機等設備上以自然語言的形式享受相關領域的智能互動信息服務。


  信息服務商只需通過得意口語對話系統(tǒng)與知識庫(或者相關的數(shù)據(jù)系統(tǒng))相聯(lián)接,就能徹底拋開厚重的手冊和復雜的編碼,代之以口語化的自然語言。原來無法開展,或者用戶難以使用的智能互動信息查詢、搜索都能很容易地實現(xiàn),為用戶提供前所未有的、自然的、互動的信息服務,如旅游交通、吃喝玩樂、金融證券、交友網聚、智力競猜、公共服務等等各個具體領域的服務,實現(xiàn) "旅游導游"、"商業(yè)導購"、"交友導聊"、"音樂導播"等智能化、實用化的服務。

  智能互動信息服務除了在互聯(lián)網上提供智能互動搜索、智能聊天等各種新穎的服務外,還特別適合手機應用。用戶在逛街、旅游、交通等室外環(huán)境、移動狀態(tài)時,更需要隨時查詢信息、聊天交友。但是手機的屏幕小、內存少、帶寬窄,不適合接收和保存大量的信息,更不可能翻看數(shù)以百計、千計的信息。傳統(tǒng)的基于關鍵詞搜索或者分類信息查詢模式都存在一定的缺陷,非常不適合在手機上使用;而基于自然語言理解技術的智能互動搜索,就能很好地為手機用戶提供隨時、隨地、隨心的信息服務。

  智能互動信息服務的興起,將帶來革命性的服務理念,實現(xiàn)"心手相通,無限自由",直接刺激用戶使用信息服務的興趣和頻率,給信息服務商和電信運營商開發(fā)嶄新且更具吸引力的業(yè)務提供平臺,為行業(yè)創(chuàng)造發(fā)展空間。

6. 得意智能互動信息服務的重大優(yōu)越性

  "得意"智能互動信息服務系統(tǒng)是技術優(yōu)越而適用性好的自然語言理解系統(tǒng),具備支持上下文相關分析(包括省略分析)、話題自由變換、人機混合主導以及口語對話等技術特點。

  普通的"智能系統(tǒng)",只具有語義分析功能,依靠語義網絡、漢語分詞、句法分析、處理同義詞等,沒有以上的技術特點。因為不支持上下文相關分析、話題自由變換、口語對話等,一般只能用于"智能搜索引擎",不適合智能聊天等服務。

  普通的"互動系統(tǒng)",能支持上下文相關分析、話題自由變換等特點,但是往往是基于統(tǒng)計的方法,依靠大規(guī)模語料庫的積累,無論是準確率、滿意度,還是系統(tǒng)的開發(fā)工作量、維護難度等,都讓很多技術開發(fā)商和信息服務商望而卻步,即使像MSN那樣開通了智能聊天服務,也只能依靠免費推廣來吸引人氣,目前還做不到實用性和商業(yè)化。

  "得意"智能互動信息服務基于得意公司完全自主知識產權的自然語言理解技術,可以更方便和更有效地實現(xiàn)智能搜索服務,為手機用戶提供更好的中文、英文等語種的"手機搜索"。

  更重要的是,得意公司開發(fā)的"得意"口語對話系統(tǒng)開發(fā)包,能支持網絡運營商、信息服務商、技術開發(fā)商等機構,把網絡搜索、數(shù)據(jù)庫營銷、智能對話等技術和應用融合起來,在互聯(lián)網、WAP、短信等各種平臺上等,為不同需求的用戶提供不同的網絡智能搜索、手機智能搜索服務,更符合國內外消費者需求,向用戶提供更為實用的細分信息搜索,成為傳統(tǒng)網絡搜索引擎的有益補充服務,更具有實用性,成為用戶隨時隨地可以享受的貼身服務,這樣也更容易實現(xiàn)手機收費搜索服務的立足點和大賣點。

7. 得意口語對話系統(tǒng)的處理能力如何?
  在以下的運行條件下,"得意口語對話系統(tǒng)"的處理能力為每秒2萬條以上的用戶請求:
  (1) 奔騰4,2GHz 2GHz;512M內存的普通PC服務器;
  (2) 關鍵詞數(shù)量小于15,000個;
  (3) 用戶輸入的句子沒有錯別字、省略、拼音等錯誤情況。

  在以下的情況下,"得意口語對話系統(tǒng)"的處理能力有相應的變化:
 。1) 如果用戶的請求中錯別字、省略、拼音等情況占20%,那么"得意口語對話系統(tǒng)"每秒的處理能力為1千條以上。
 。2) 如果使用檔次更高、處理速度更快的網絡服務器,那么"得意口語對話系統(tǒng)"的處理能力將有相應的提高。
  (3) "得意口語對話系統(tǒng)"支持多服務器運行模式,可以配置多臺服務器同時處理不同的用戶請求。因此,如果增加服務器的數(shù)量,那么系統(tǒng)的處理能力將相應提高。
 。4) 如果關鍵詞的數(shù)量減少,"得意口語對話系統(tǒng)"系統(tǒng)的處理能力相應有所提升;反之,如果關鍵詞的數(shù)量增加,處理能力相應有所下降。
 。5) 如果智能互動信息服務系統(tǒng)需要頻繁地讀取數(shù)據(jù)庫內容,由于"得意口語對話系統(tǒng)  "對于自然語言的處理能力大大高于數(shù)據(jù)庫系統(tǒng)的處理能力,那么整個信息服務系統(tǒng)的處理能力瓶頸在于數(shù)據(jù)庫的處理能力,與"得意口語對話系統(tǒng)"本身的處理能力無關。

  "得意口語對話系統(tǒng)"可以充分滿足互聯(lián)網、短信、WAP等業(yè)務的智能互動信息服務需求,為SP和用戶提供了更易用、好用、實用的信息交流平臺。

8.得意智能互動信息服務在短信和WAP上的應用

  SP可根據(jù)具體應用領域定制一系列的SMS/WAP的智能查詢和下載服務,并支持各類實用的信息服務:

  固定信息:歌曲鈴聲圖片下載、航班火車時刻、吃喝玩樂、旅游、氣象;
  實時動態(tài)信息:金融證券咨詢、體育比賽賽前分析和賽果發(fā)布、地產租房、求職招聘、商品打折、商業(yè)黃頁等等;
  互動信息:交友、有獎競猜、智力游戲等等。

  服務商和用戶從此拋開厚重的手冊和復雜的編碼,代之以口語化的自然語言通過短信輸入,系統(tǒng)能迅速理解用戶的意思,提供準確、周到的信息和服務。這樣的服務將直接刺激用戶的興趣和使用頻率,并為SP和電信運營商開發(fā)更新的、更具吸引力的業(yè)務創(chuàng)造了很好的條件。

9. 得意智能互動信息服務在智能聊天機器人的應用

  目前流行于各大網站、各類即時通訊軟件的聊天機器人僅僅實現(xiàn)了基本的、簡單的對話交流、信息查詢等功能,而且技術方向是基于統(tǒng)計的方法建立知識庫,對于知識庫的要求高而且維護量極大,也不容易修改和調整。

  基于得意公司的智能互動系統(tǒng),可以開發(fā)出全新的交友聊天的應用。目前SP各類的交友服務,一般只能根據(jù)"年齡"、"性別"、"所在城市"等屬性來撮合,能找到雙方都基本滿意的情況基本上屬于是"瞎貓碰死耗子"的小概率事件,用戶流失度非常大;而且各個SP產品的同質化很高,競爭非常激烈。如果應用了"得意"智能互動系統(tǒng),就能給用戶提供個性化的、智能化的"導聊"服務,讓電腦系統(tǒng)自動引導用戶方便、準確地描述出自己的類型和喜歡的類型,從而能很容易地推薦出合適的對象,大大提升了用戶的滿意度和忠誠度,確保了交友服務的效果。

 。1) 用戶可以完全以自然語言方式輸入,直接輸入年齡、學歷、愛好、職業(yè)等等各種屬性,輸入格式可以多樣化,無需通過菜單選擇或者嚴格按照固定的格式,系統(tǒng)都可以智能地自動識別用戶的各種屬性和需要尋找的類型;

 。2) 允許用戶以多種非規(guī)范輸入方法進行檢索:錯別字、拼音輸入、屬性名稱聲母字頭輸入、屬性的部分文字,系統(tǒng)能根據(jù)規(guī)則和關鍵詞庫快捷、準確地識別;

 。3) 能根據(jù)系統(tǒng)定義的規(guī)則,對用戶的輸入進行歸類和處理,從而讓用戶無需任何學習和了解任何代碼,就能用自然語言方便、準確地描述自己的需求,最大程度地方便用戶,兼容各種復雜的需求,保證系統(tǒng)的易用性、可靠性和成功率。

10. 得意智能互動搜索在"商業(yè)黃頁"、"電子商務"的應用

  目前,主流的搜索引擎、門戶網站、專業(yè)網站以及電信網絡運營商等,都紛紛介入"商業(yè)黃頁"、"電子商務"等類似的增值服務,以便捷的網絡手段向廣大用戶提供及時、準確、詳實、豐富的商業(yè)信息;同時,構建一個資源豐富、信息準確、查詢方便、界面美觀的企業(yè)信息展示、產品和廣告發(fā)布平臺,后臺提供黃頁資源數(shù)據(jù)、企業(yè)客戶和代理商的信息,產品和廣告信息的管理維護后臺,以贏得市場,獲取收益。并網站和引擎進一步開發(fā)出更多增值服務產品,包括:提供信息檢索、廣告以及其他電子商務或增值服務等。

  但是,由于商業(yè)行業(yè)數(shù)以百計,涉及的商品數(shù)以萬計,黃頁中的商業(yè)機構多達幾十萬家;而商業(yè)黃頁或者電子商務引擎中,分類的標準、排序的方式、商家重視的方向、用戶關心的信息等各種關系紛繁復雜,日新月異,F(xiàn)有各網站和信息服務商基本只能依靠大量的信息采集員和編輯員進行歸類、整理、發(fā)布,耗時費力;大部分用戶在使用黃頁時,往往陷入信息的汪洋大海中,而且用戶經常不能正確輸入所屬大類小類、商品名、公司名等等,導致檢索不出所需產品;或者用戶需要對同類商品之間的各類屬性進行比較時,目前的系統(tǒng)除了價格范圍、命中程度等有限的屬性外,不能為用戶提供更多的信息,導致用戶的滿意度和忠誠度不高。

  "得意"智能互動搜索,依靠"得意"口語對話系統(tǒng)開發(fā)工具,具備支持上下文相關分析(包括省略分析)、話題自由變換、人機混合主導以及口語對話等技術特點;可以識別并回答用戶的問題,能最大程度地了解用戶的信息需求,獲得更高的易用性、更準確的范圍定位、更智能的搜索結果;使用戶擺脫了傳統(tǒng)搜索引擎基于關鍵字的束縛,指引用戶更有效、更快捷地尋找到所需的資料,同時為用戶提供相關的、有參考價值的其他內容,成為用戶得心應手的"智能導購"。

11.與一般的"智能"、"互動"系統(tǒng)相比有什么區(qū)別和優(yōu)越性?

  "得意"智能互動信息服務系統(tǒng)是技術優(yōu)越而適用性好的自然語言理解系統(tǒng),具備支持上下文相關分析(包括省略分析)、話題自由變換、人機混合主導以及口語對話等技術特點。

  上下文相關分析是指系統(tǒng)在理解當前語句時可以聯(lián)想用戶以前所說的話,進行綜合分析,因此即使有時用戶所說的話有一定的省略,系統(tǒng)照樣可以理解。

  話題自由變換是指系統(tǒng)允許用戶在多個話題之間不斷轉換,系統(tǒng)照樣可以記住以前的談話內容,比如用戶在問航班起飛時間時,突然問目的地與本地的時差,然后再確認要先前詢問的航班,系統(tǒng)都能滿意回答。而目前的一些系統(tǒng),對話往往只能局限于某一個話題,一旦用戶變換話題,系統(tǒng)將無所適從。

  人機混合主導則是完全的自然對話,用戶可以轉換話題后在回到原來的話題(像人一樣);用戶可以"答非機問"(多回答或少回答);……而系統(tǒng)都可以根據(jù)實際情況提取語義信息,如果用戶詢問的信息足夠,那么系統(tǒng)直接回答問題;而如果用戶詢問的信息不全或者用戶遲疑太久,那么系統(tǒng)主動詢問來獲取足夠的信息。而不具備人機混合主導性能的系統(tǒng)只能等用戶發(fā)問,如果用戶根本不知道問什么,那么系統(tǒng)將一直待機等待。

  普通的"智能系統(tǒng)",只具有語義分析功能,依靠語義網絡、漢語分詞、句法分析、處理同義詞等,沒有以上的技術特點。因為不支持上下文相關分析、話題自由變換、口語對話等,一般只能用于"智能搜索引擎",不適合智能聊天等服務。

  普通的"互動系統(tǒng)",能支持上下文相關分析、話題自由變換等特點,但是往往是基于統(tǒng)計的方法,依靠大規(guī)模語料庫的積累,無論是準確率、滿意度,還是系統(tǒng)的開發(fā)工作量、維護難度等,都讓很多技術開發(fā)商和信息服務商望而卻步,即使像MSN那樣開通了智能聊天服務,也只能依靠免費推廣來吸引人氣,目前還做不到實用性和商業(yè)化。

附:得意公司與TOM.com合作提供的WAP智能搜索服務

  得意公司擁有先進的中文自然語言理解技術和國際首創(chuàng)的"口語對話系統(tǒng)開發(fā)工具(SDS SDK)", TOM在線公司是國內領先的電信增值服務提供商,日前雙方緊密合作,在中國聯(lián)通CDMA網絡上開通了"鈴聲智能搜索王"業(yè)務。此業(yè)務近期還將在中國聯(lián)通GSM網絡和中國移動GSM網絡開通,覆蓋全國所有手機用戶。此業(yè)務的開通,標志著智能信息服務在國內電信增值領域獲得了重要發(fā)展。

  "鈴聲智能搜索王"業(yè)務的使用方法是:使用聯(lián)通CDMA手機,依次進入"互動視界"-》"休閑娛樂"-》"生活咨詢"-》"天下任我行"-》"智能搜索王"欄目,就能簡單、方便、靈活地搜索所需的歌曲,下載鈴聲。"鈴聲智能搜索王"系統(tǒng)功能強大而實用:支持用戶統(tǒng)一輸入,智能識別,允許用戶以多種多樣的格式和非規(guī)范方法搜索歌曲鈴聲,是國內和國際技術領先、性能出色的無線網絡智能搜索服務系統(tǒng)。

1、統(tǒng)一輸入,智能識別
  當用戶訪問智能搜索系統(tǒng)時,他們不需要選擇目錄或者菜單,而是可以立即在用戶輸入區(qū)里面輸入他們想查詢的歌手或歌曲等內容,輸入格式可以多樣化,無需通過菜單選擇,而系統(tǒng)都可以智能地自動識別。

2、支持各種復雜的輸入格式:
等等

3、允許用戶以多種非規(guī)范輸入法進行搜索:錯別字、拼音輸入、歌手/歌曲名稱聲母頭字母輸入、歌手/歌曲名稱的部分文字
等等

  歡迎訪問得意公司網站了解"得意"口語對話系統(tǒng)開發(fā)包更多的信息:
  http://www.d-ear.com/Technologies&Products/FAQ.htm#_Toc79434173
  如果有寶貴的意見或者建議,歡迎與得意公司聯(lián)系:
  Email:postmaster@d-ear.com 電話:(8610)8289-3531/2

得意口語對話系統(tǒng)開發(fā)軟件免費技術和應用培訓

得意音通公司供稿 CTI論壇編輯



相關鏈接:
得意珠三角綜合智能信息增值平臺項目中標 2009-08-20
北京軟件產品質量檢測檢驗中心對《海量語音文件的目標說話人篩選系統(tǒng)》進行測試 2009-06-25
廣東政府和清華大學舉行了全面開展產學研合作協(xié)議簽約儀式 2009-06-25
得意中文整句輸入法V1.0開源for Windows Mobile5.0 2009-01-23
得意聲紋識別VPR4.0_b20080808新版本發(fā)布 2008-08-27

分類信息:  語音合成TTS_與_語音識別ASR     文摘   技術_語音應用_新聞   技術_語音應用_新聞