東進中文語音識別 ASR 簡介
概論:
東進中文語音系列產品,是采用了美國IBM公司的ViaVoice for Telephony技術合作開發(fā)的。產品系列覆蓋語音識別、語音合成兩大領域,支持中文(簡體漢字、繁體漢字)、英語等語言。
中文語音識別(ASR—Automatic Speech Recognization),是CTI中的一項核心技術,能夠為語音門戶、電子商務、呼叫中心、電話通訊系統提供中文語音交互界面。
中文語音識別技術
東進中文語音技術,針對電話應用進行特殊優(yōu)化,系統開發(fā)人員可以方便地在電話通訊系統及網絡平臺上集成中文語音功能。東進中文語音識別引擎的特點是:
與說話人無關:任何人都可以使用。
高識別率:內部的語音識別引擎是使用真實的電話信道語音數據訓練得到的,在正常的電話信道(包括手機或普通電話)的噪音下有很高的識別率。
無限詞匯量:由于語音識別內核是比基本音節(jié)還要小的單元,所以開發(fā)人員定義的任何詞表,它都可以很好的辨識。
連續(xù)發(fā)音:使用者不需要在詞匯間有任何停頓,就可以同系統連續(xù)交談。
多語種支持:在中文普通話和粵語之外,同時支持美國英語、英國英語、法語、德語。
多候選集的輸出:能夠輸出不同的候選結果相似度得分。
支持聲學加詞:說話人只需要輸入語音信號即可完成加詞。
支持語音合成:能夠從文字直接生成高自然度、高清晰度、高可懂度的語音。
信道自適應:可以自動適應不同信噪比的電話信道。
自然語言理解模塊:提供更加人性化的人-機對話接口。
出色的可伸縮性:提供從小型辦公室到企業(yè)級電話語音系統解決方案,小到單機系統,大到可靈活組合的客戶服務器模式,更提供全自動的動態(tài)負載平衡,讓您有限的投入能夠獲得更高的效能。