科大訊飛電話語(yǔ)音識(shí)別InterReco
2.0——應(yīng)用開(kāi)發(fā)及工具包
2008/08/18
為了方便語(yǔ)音識(shí)別系統(tǒng)的開(kāi)發(fā),InterReco2. 0提供了一系列的開(kāi)發(fā)接口和應(yīng)用工具,從而使得應(yīng)用系統(tǒng)的開(kāi)發(fā)更加高效,主要包含如下:
一、應(yīng)用開(kāi)發(fā)接口
語(yǔ)音識(shí)別接口是InterReco提供的最重要的對(duì)外接口,是應(yīng)用開(kāi)發(fā)人員使用識(shí)別引擎進(jìn)行語(yǔ)音識(shí)別開(kāi)發(fā)所必需使用的接口。這個(gè)接口提供強(qiáng)大的功能,能夠發(fā)揮InterReco語(yǔ)音識(shí)別系統(tǒng)的優(yōu)勢(shì),通過(guò)不同的并發(fā)編程模型簡(jiǎn)化編程復(fù)雜度,優(yōu)化系統(tǒng)性能表現(xiàn)。
語(yǔ)法編譯管理接口提供API形式的語(yǔ)法編譯和管理的方法,主要用來(lái)解決動(dòng)態(tài)語(yǔ)法的編譯、加載、激活的過(guò)程。用戶根據(jù)需要使用這些接口可以對(duì)自己的應(yīng)用程序做出恰當(dāng)?shù)膬?yōu)化,提高應(yīng)用系統(tǒng)靈活性。語(yǔ)法管理接口允許用戶管理和設(shè)置語(yǔ)法緩沖的策略。
端點(diǎn)檢測(cè)是語(yǔ)音識(shí)別一個(gè)重要的輸入環(huán)節(jié),該接口允許用戶通過(guò)編程對(duì)端點(diǎn)檢測(cè)的處理策略,和語(yǔ)音識(shí)別引擎進(jìn)行交互。
該接口提供一套能夠使用戶把電話語(yǔ)音輸入設(shè)備掛接到InterReco語(yǔ)音識(shí)別引擎的方法,包含各種品牌的電話語(yǔ)音卡和麥克風(fēng)。通過(guò)這個(gè)接口,能夠消除輸入設(shè)備的多樣化帶來(lái)的集成復(fù)雜度,使得產(chǎn)品在音頻輸入方面具備優(yōu)秀的可擴(kuò)展性。
該接口提供管理維護(hù)接口、日志接口、以及其他一些輔助接口。
二、應(yīng)用優(yōu)化方法
分析和優(yōu)化在語(yǔ)音識(shí)別的開(kāi)發(fā)、應(yīng)用過(guò)程中扮演非常重要的角色,好的分析和優(yōu)化工具往往能夠決定語(yǔ)音識(shí)別的應(yīng)用是否能夠成功。InterReco
2.0中提供的主要分析優(yōu)化方法有:
通過(guò)Call-Log紀(jì)錄,使用分析工具分析統(tǒng)計(jì),得出當(dāng)前應(yīng)用的總體識(shí)別率、語(yǔ)法內(nèi)識(shí)別率等重要技術(shù)指標(biāo)。這些指標(biāo)能夠反映出當(dāng)前語(yǔ)音應(yīng)用的總體識(shí)別效果,同時(shí)也能夠分析應(yīng)用中存在的問(wèn)題。
通過(guò)識(shí)別效果的分析,對(duì)識(shí)別的語(yǔ)音界面、識(shí)別語(yǔ)法、識(shí)別模型、系統(tǒng)參數(shù)進(jìn)行優(yōu)化,以達(dá)到提高用戶滿意度,提升識(shí)別效果的目的。
分為無(wú)監(jiān)督和有監(jiān)督的自適應(yīng),識(shí)別系統(tǒng)在運(yùn)行過(guò)程中會(huì)以一定的間隔對(duì)當(dāng)前的應(yīng)用場(chǎng)景進(jìn)行一次無(wú)監(jiān)督的聲學(xué)模型自適應(yīng),這種適應(yīng)的內(nèi)容包括:說(shuō)話人特征自適應(yīng),包含口音和方言;通道特征自適應(yīng),包含無(wú)線通道、VoIP編解碼通道;應(yīng)用特征,包含詞匯、環(huán)境噪聲等。
三、工具包
InterReco提供了豐富的開(kāi)發(fā)調(diào)試工具,能夠在集成開(kāi)發(fā)的過(guò)程中為用戶提供全面有效的支持。主要包含:
識(shí)別演示程序是一個(gè)基于對(duì)話框風(fēng)格的Windows GUI界面,其主要功能是在Windows環(huán)境下,為用戶提供一個(gè)簡(jiǎn)便、友好的方式,使得用戶能夠使用麥克風(fēng)完成基本識(shí)別功能,或者使用離線識(shí)別功能,也可以設(shè)置一些系統(tǒng)參數(shù)驗(yàn)證其效果。
用戶來(lái)可以直接用文本而不是實(shí)際語(yǔ)音對(duì)于自己編寫(xiě)的語(yǔ)法進(jìn)行分析和調(diào)試。主要功能有:輸出語(yǔ)法的所有定義范圍、測(cè)試一個(gè)說(shuō)法是否滿足語(yǔ)法要求。
管理語(yǔ)法緩存工具,可以使用該工具查看當(dāng)前InterReco系統(tǒng)語(yǔ)法緩存的詳細(xì)情況,還可以使用該工具手工刪除指定的語(yǔ)法緩存條目,該工具還提供了預(yù)先編譯語(yǔ)法文件的功能。
用戶自定義詞典工具。通過(guò)該工具,可以對(duì)輸入詞條列表生成發(fā)音,并保存為用戶自定義詞典。
這些開(kāi)發(fā)接口和工具包可以幫助合作伙伴更快速的將語(yǔ)音識(shí)別產(chǎn)品集成到各中應(yīng)用系統(tǒng)中,并作為合作伙伴在語(yǔ)音識(shí)別業(yè)務(wù)設(shè)計(jì)、調(diào)試和效果優(yōu)化等各階段的技術(shù)助手,幫助合作伙伴更快速的開(kāi)發(fā)成功的語(yǔ)音識(shí)別應(yīng)用系統(tǒng)。
CTI論壇編輯
相關(guān)鏈接:
四会市|
儋州市|
潼南县|
扬州市|
玉林市|
石楼县|
方山县|
苍梧县|
樟树市|
登封市|
杨浦区|
喀什市|
巴林右旗|
桦甸市|
微博|
阳东县|
钟祥市|
周至县|
定兴县|
太仓市|
宕昌县|
当涂县|
万全县|
宁波市|
马关县|
夏河县|
静乐县|
临泽县|
广元市|
广饶县|
关岭|
德令哈市|
汉沽区|
依兰县|
梁平县|
阿坝|
班戈县|
永泰县|
天峨县|
涿州市|
和林格尔县|