1.1市場背景
隨著信息平臺的多樣化,傳統(tǒng)的聲訊服務正在經(jīng)受著越來越嚴峻的考驗。伴隨著互聯(lián)網(wǎng)的迅速普及,人們對信息更新速度的要求也越來越高。同時,傳統(tǒng)的人工聲訊以及用人工錄音實方式現(xiàn)的自動聲訊服務需要很高的日常維護費用,這使得聲訊臺的運營者不堪重負。而恰恰在此時,北京捷通華聲軟件技術有限公司的語音合成(Text To Speech)技術實現(xiàn)了飛躍性的突破,從而使真正意義上的自動聲訊得以實現(xiàn)。
TTS(Text To Speech)技術就是將計算機中的文本轉換為語音的過程,它可以輕而易舉地將傳統(tǒng)的人工聲訊系統(tǒng)轉換為自動聲訊系統(tǒng)。信息的提供者只需要更新數(shù)據(jù)庫中的文本內容,利用TTS技術,信息的需求者就可以通過電話隨時獲取最新的信息。與傳統(tǒng)的聲訊服務相比,自動聲訊系統(tǒng)無論是在信息的更新速度、維護成本、操作靈活性上,還是在服務的質量、管理、規(guī)范上都有著絕對的優(yōu)勢。因此,隨著新一代TTS技術的誕生,自動聲訊系統(tǒng)正在以無法阻擋的速度,占領著原有的聲訊市場。
1.2技術背景
要想實現(xiàn)真正的自動聲訊系統(tǒng),需要在幾個關鍵部分實現(xiàn)技術突破,只有關鍵技術達到了產(chǎn)品化的要求,市場運作才成為可能。
第一:任意文本合成
為了使各種各樣的文本信息能夠及時的轉化為語音,TTS技術必須能夠做到任意文本合成,也就是說它的音庫必須能夠適應各個行業(yè)語言習慣,只有這樣,信息的提供者才能不受局限地為用戶提供各種信息。
第二:即時合成
如果事先把文本合成為語音,再存放到服務器中播放給用戶,那無疑又回到了原有聲訊服務的模式,更新速度及工作量都不能滿足要求。因此,TTS技術必須能夠做到即時合成,即:當用戶向聲訊服務器發(fā)出信息請求時,聲訊服務器做出分析判斷,并從內容數(shù)據(jù)庫中提取相應文本,然后發(fā)送給語音合成服務器。語音服務器邊合成邊回傳給聲訊服務器,進而再傳送給用戶。整個的合成過程是在用戶收聽的同時進行的,不能有明顯的延遲,也不能在播放的過程中停頓,這就要求TTS技術有相當?shù)姆(wěn)定性以及非常快的合成速度。
第三:自然語調合成
為什么TTS技術經(jīng)過數(shù)十年地研究,一直都沒有得到大規(guī)模的實際應用?其主要原因就在于早期的合成語音效果一直沒有達到真正自然的階段,僅達到“可以聽懂”的水平。因此,傳統(tǒng)的聲訊服務系統(tǒng)寧愿花大力氣去進行人工錄音,也不愿意給用戶聽一些磕磕絆絆的合成效果,這也正是長期以來制約自動聲訊系統(tǒng)發(fā)展的一個重要因素。
捷通華聲公司2001年7月份推出的TTS核心在合成語音的質量上實現(xiàn)了飛躍,成功地實現(xiàn)了自然語調合成,字詞間平滑過度。這標志著自動聲訊系統(tǒng)的又一技術壁壘被打破了。
第四:“集群式并發(fā)”處理
眾所周知,聲訊服務的用戶數(shù)量是相當巨大的,當大量的用戶同時向聲訊服務器發(fā)出信息請求時,我們稱之為“集群式并發(fā)”。
每臺服務器的負載能力是有限的,因此,通常中型以上的聲訊系統(tǒng)中都會采用多臺聲訊服務器及多臺語音合成服務器。那么,如何解決好多臺服務器之間的負載平衡問題就顯得尤為重要。如果不能解決負載問題,在系統(tǒng)實際運行中就會造成某些服務器滿負荷運轉,而某些服務器則長期空閑,不僅是對資源的浪費,而且會直接影響到整個聲訊服務系統(tǒng)的暢通。
捷通華聲公司針對這一現(xiàn)象做了專門的研究,并開發(fā)出了“動態(tài)負載平衡機制”。通過捷通華聲的動態(tài)負載平衡機制,語音服務器可以動態(tài)地分配語音合成請求,使多臺服務器的負載相對比較均衡,以確保整個聲訊系統(tǒng)保持最佳的運行效果。
捷通華聲動態(tài)負載平衡機制的成功研制,為大規(guī)模自動聲訊服務的實現(xiàn)奠定了穩(wěn)固的技術基礎。
1.3技術流程
當用戶通過電話向聲訊服務器發(fā)出請求時,聲訊服務器會首先作出分析判斷,然后從內容數(shù)據(jù)庫中提取相應的文本信息,經(jīng)過負載平衡機制發(fā)送給語音合成服務器。語音合成服務器在接收到文本后立刻開始合成,同時將合成好的語音發(fā)送回語音服務器,再由語音服務器回傳給用戶。其中內容數(shù)據(jù)庫中的信息可以由系統(tǒng)管理員定期進行維護管理。(系統(tǒng)連接結構見流程圖)
1.4配置要求
1.語音服務器配置:單CPU——PIII 800;內存256M或更高(具體數(shù)量根據(jù)聲訊系統(tǒng)規(guī)模而定)
2.軟件需求:操作系統(tǒng)、jTTS系統(tǒng)、捷通華聲動態(tài)負載平衡機制
捷通華聲TTS在聲訊領域的應用(流程圖)
捷通華聲供稿 CTI論壇編輯