首頁>>廠商>>語音板卡開發(fā)商>>東進技術(shù)

D系列語音卡的連續(xù)語音處理技術(shù)(CSP

D系列語音卡采用DSP技術(shù)進行連續(xù)語音處理(CSP,Continuous Speech Process),在電話線路與語音識別引擎之間對語音數(shù)據(jù)進行預(yù)處理,從而提高了語音識別引擎的效率和識別率,為ASR的成熟應(yīng)用奠定了基礎(chǔ),而東進D系列語音卡和IBM的綜合語音處理解決方案也成為應(yīng)用系統(tǒng)開發(fā)者的首選。

1、回聲消除(ECR)。

ECREcho Cancellation Resource)是基于DSP技術(shù)對語音通道的聲音進行的實時控制。其實現(xiàn)方法在于:在電話線路上收到的聲音里去掉IVR系統(tǒng)播放的聲音,從而保證收到的聲音是純凈的,如下圖所示。

ECR原理

語音識別的過程實際是一個錄音和聲音比較的過程。當錄下來的聲音(收到的聲音)是純凈或者比較純凈的時候,識別率將大大提高。

試驗表明,采用回聲消除技術(shù)后,語音識別率得到顯著提高,從原有的70-80%提高到95%以上,滿足了商用要求。

2、語音打斷(Barge in

語音打斷可以減輕系統(tǒng)資源占用,提高語音識別系統(tǒng)的利用效率,而且減少用戶等待的時間,節(jié)省話費開支,為構(gòu)建高精度和高密度的系統(tǒng)創(chuàng)造了條件。

3、語音檢測(VAD)

語音檢測 (VAD-Voice Activity Detection)技術(shù)的應(yīng)用是實現(xiàn)語音打斷的前提。其原理是檢測線路上的聲音能量(Voice Energy Detection),只有在檢測到語音後才啟動錄音和語音識別進程。

4、4-120路語音處理,D系列語音卡可以支持4-120路連續(xù)語音處理能力。

5、基于D系列語音卡的ASR的結(jié)構(gòu),如下圖所示: