科大訊飛電話語(yǔ)音識(shí)別InterReco
2.0——產(chǎn)品簡(jiǎn)介
2008/08/11
一、產(chǎn)品概述
電話語(yǔ)音識(shí)別引擎InterReco2.0可以為自助式電話語(yǔ)音系統(tǒng)提供完善的語(yǔ)音識(shí)別技術(shù)解決方案。集成InterReco2.0的自助式語(yǔ)音系統(tǒng)能夠?yàn)榭蛻籼峁┤旌虻膬?yōu)質(zhì)語(yǔ)音服務(wù),從而確保以較低的投入顯著提高客戶滿意度。
科大訊飛電話語(yǔ)音識(shí)別產(chǎn)品整合了科大訊飛研究院、清華訊飛語(yǔ)音實(shí)驗(yàn)室及科大訊飛語(yǔ)音實(shí)驗(yàn)室在語(yǔ)音識(shí)別技術(shù)上多年的積累,專門針對(duì)中文語(yǔ)音識(shí)別的技術(shù)特點(diǎn)進(jìn)行了全面優(yōu)化。對(duì)于中文語(yǔ)音識(shí)別應(yīng)用中經(jīng)常面臨的方言口音、復(fù)雜信道和背景噪聲等問(wèn)題,依據(jù)從實(shí)際業(yè)務(wù)系統(tǒng)中收集的涵蓋不同方言和不同環(huán)境噪聲的海量語(yǔ)音數(shù)據(jù),采用最新的區(qū)分性訓(xùn)練方法進(jìn)行語(yǔ)音建模,從而使InterReco2.0在復(fù)雜應(yīng)用環(huán)境下可以擁有良好的一致性效果表現(xiàn),核心技術(shù)效果達(dá)到國(guó)際領(lǐng)先。InterReco2.0產(chǎn)品架構(gòu)上延用了科大訊飛在語(yǔ)音合成中久經(jīng)錘煉的高穩(wěn)定分布式語(yǔ)音平臺(tái),可以滿足電信級(jí)應(yīng)用的高可靠性要求。
二、產(chǎn)品功能:
InterReco2.0在復(fù)雜環(huán)境的識(shí)別效果均有不俗表現(xiàn),產(chǎn)品考慮了呼叫中心、增值服務(wù)中的不同應(yīng)用特點(diǎn),易于開(kāi)發(fā)集成及進(jìn)行業(yè)務(wù)開(kāi)發(fā),主要功能有如下:
- 大詞匯量、獨(dú)立于說(shuō)話人的健壯識(shí)別功能
識(shí)別系統(tǒng)能對(duì)多種語(yǔ)言進(jìn)行大詞匯量的識(shí)別,在中文識(shí)別方面使用了訊飛TTS引擎使用的詞典和文本分析技術(shù),能夠?qū)φZ(yǔ)法內(nèi)容進(jìn)行分詞處理,保證多音字的識(shí)別效果。
- 端點(diǎn)檢測(cè)與打斷(End Pointer && Barge-In)
端點(diǎn)檢測(cè)是對(duì)輸入的音頻流確定語(yǔ)句的起始和終止的處理過(guò)程。當(dāng)找到語(yǔ)句的起始和終止點(diǎn)后,語(yǔ)句區(qū)向前后分別延伸預(yù)定的長(zhǎng)度。一旦檢測(cè)到語(yǔ)句的起始點(diǎn),語(yǔ)音開(kāi)始流向識(shí)別引擎,直到檢測(cè)到語(yǔ)句的終止點(diǎn)。通過(guò)這種方式,識(shí)別引擎在用戶在講話的同時(shí),已經(jīng)開(kāi)始處理講話的內(nèi)容,而又不需要處理語(yǔ)音的起止處多余的靜音,從而節(jié)約CPU時(shí)間和網(wǎng)絡(luò)帶寬。
打斷功能使用戶可以打斷提示、作出響應(yīng),無(wú)需等到提示音結(jié)束播放。打斷功能使得用戶和系統(tǒng)間的交流更加快捷、自然,特別是系統(tǒng)的熟練用戶。
- 多識(shí)別結(jié)果和置信度(N-Best && CM)
對(duì)于有些應(yīng)用程序,可能需要識(shí)別引擎產(chǎn)生可能的識(shí)別結(jié)果集,而不是一個(gè)最好的結(jié)果。系統(tǒng)提供了可能的識(shí)別結(jié)果列表,并按可能性從高到低排列。
語(yǔ)音識(shí)別引擎在返回識(shí)別結(jié)果時(shí)會(huì)攜帶該識(shí)別結(jié)果的置信度,對(duì)多個(gè)識(shí)別結(jié)果給出其可能性的指標(biāo),準(zhǔn)確的置信度輸出可以為識(shí)別結(jié)果的分析和后續(xù)處理提供依據(jù),改善在用戶語(yǔ)音不清晰、語(yǔ)義不明確時(shí)的效果體驗(yàn)。
- 語(yǔ)音錄入(Voice Enrollment)
允許用戶通過(guò)本人語(yǔ)音來(lái)向動(dòng)態(tài)語(yǔ)法增加命令或詞表。這種方式不但能夠有效利用用戶個(gè)性化的語(yǔ)音,提高系統(tǒng)的識(shí)別準(zhǔn)確率;而且能夠提高用戶輸入詞表的方便性和靈活性。例如,在語(yǔ)音通訊錄的應(yīng)用中,用戶可以通過(guò)語(yǔ)音的方式來(lái)添加通訊錄,從而使用戶可以隨時(shí)隨地修改自己的通訊錄。
- 動(dòng)態(tài)語(yǔ)法
動(dòng)態(tài)語(yǔ)法是由應(yīng)用程序在運(yùn)行時(shí)動(dòng)態(tài)創(chuàng)建和修改的語(yǔ)法。這在應(yīng)用程序詞匯必須在運(yùn)行時(shí)才能完全確定的情況下是必不可少的。
- 呼叫日志(Call Logging)
語(yǔ)音識(shí)別的調(diào)用日志在系統(tǒng)中有著非常重要的作用,該日志記錄了輸入的音頻、加載的語(yǔ)法、識(shí)別過(guò)程的中間結(jié)果、識(shí)別模塊調(diào)用過(guò)程、識(shí)別使用的各種參數(shù)、識(shí)別結(jié)果以及當(dāng)時(shí)的系統(tǒng)環(huán)境信息。這些數(shù)據(jù)是效果分析的依據(jù),詳盡的Call-Log是效果優(yōu)化的基礎(chǔ)。
- 說(shuō)話人自適應(yīng)
當(dāng)用戶多次使用同一識(shí)別系統(tǒng)時(shí),識(shí)別引擎能夠逐步適應(yīng)其口音,使該使用者的識(shí)別效果逐步提高。同時(shí),如果預(yù)先給定特定說(shuō)話人的數(shù)據(jù),系統(tǒng)可以針對(duì)特定說(shuō)話人進(jìn)行自適應(yīng)訓(xùn)練以獲得更加適合其發(fā)音特征的語(yǔ)音模型,使該說(shuō)話人在使用系統(tǒng)時(shí),識(shí)別效果更好。
- 多槽識(shí)別
語(yǔ)音識(shí)別的槽(Slot)代表一個(gè)關(guān)鍵字,即在一次識(shí)別中可以識(shí)別多個(gè)關(guān)鍵字,這種識(shí)別模式可以提高語(yǔ)音識(shí)別的使用效率和用戶體驗(yàn)。
- 模型自適應(yīng)
針對(duì)每個(gè)應(yīng)用專門優(yōu)化通用模型從而更加適合應(yīng)用:包括方言和口音的說(shuō)話人特征,無(wú)線設(shè)備、VoIP設(shè)備等通道特征,詞匯和環(huán)境噪聲等應(yīng)用特征。
InterReco2.0除了在核心技術(shù)指標(biāo)上一系列優(yōu)異的表現(xiàn)外,針對(duì)語(yǔ)音識(shí)別集成開(kāi)發(fā)和業(yè)務(wù)實(shí)現(xiàn)難的問(wèn)題,InterReco2.0還提供了一整套易用的開(kāi)發(fā)接口和工具,使語(yǔ)音識(shí)別應(yīng)用的合作伙伴可以基于該引擎方便的開(kāi)發(fā)應(yīng)用系統(tǒng),并通過(guò)所提供的工具及時(shí)發(fā)現(xiàn)開(kāi)發(fā)中出現(xiàn)的問(wèn)題。此外InterReco2.0在業(yè)務(wù)實(shí)現(xiàn)階段,提供了簡(jiǎn)單易用的語(yǔ)法設(shè)計(jì)和實(shí)現(xiàn)方式,用戶甚至寫漢字就可以實(shí)現(xiàn)語(yǔ)音識(shí)別語(yǔ)法的編寫,系統(tǒng)還提供了語(yǔ)法向?qū)В渲幸呀?jīng)內(nèi)置了常用業(yè)務(wù)語(yǔ)法,使用戶可以更簡(jiǎn)單的使用語(yǔ)音識(shí)別系統(tǒng)。相信隨著科大訊飛發(fā)布國(guó)際領(lǐng)先的電信級(jí)中文語(yǔ)音識(shí)別產(chǎn)品,通過(guò)和合作伙伴的共同努力,語(yǔ)音識(shí)別將為合作伙伴帶來(lái)更大的增值空間,中文語(yǔ)音識(shí)別產(chǎn)業(yè)將獲得更快的發(fā)展。
CTI論壇編輯
相關(guān)鏈接:
河北区|
洞头县|
屏山县|
奈曼旗|
平和县|
通山县|
齐齐哈尔市|
马尔康县|
罗田县|
延川县|
西青区|
安陆市|
古蔺县|
溆浦县|
特克斯县|
托里县|
云和县|
绩溪县|
汉中市|
潞西市|
西乌|
尼木县|
彭泽县|
玉溪市|
开鲁县|
焦作市|
曲水县|
佛坪县|
林西县|
宝应县|
高雄市|
左贡县|
竹溪县|
保德县|
清远市|
三明市|
清丰县|
基隆市|
太原市|
札达县|
潞城市|