TTS即語音合成技術(Text To Speech),它涉及聲學、語言學、數(shù)學信號處理技術、多媒體技術等多個學科技術,是中文信息處理領域的一項前沿技術,實現(xiàn)把計算機中任意出現(xiàn)的文字轉換成自然流暢的語音輸出。
TTS在CTI系統(tǒng)中可以應用在IVR(交互式語音應答)服務器上,以提供語音交互式平臺,為用戶電話來訪提供語音提示,引導用戶選擇服務內容和輸入電話事務所需的數(shù)據(jù),并接受用戶在電話撥號鍵盤上輸入的信息,實現(xiàn)對計算機數(shù)據(jù)庫等信息資料的交互式訪問。
在IVR中應用TTS可以自動將文本信息轉換為語音文件,或者實時地將文本信息合成語音并通過電話發(fā)布。實現(xiàn)文本與語音自動雙向轉換,以達到人與系統(tǒng)的自動交互,隨時隨地為客戶服務。維護人員不必再人工錄音,只須將電子文檔引入系統(tǒng)中,系統(tǒng)可以自動將電子文檔轉換為語音信息播放給客戶。數(shù)據(jù)庫中存放的大量數(shù)據(jù),無需事先進行錄音,能夠隨時根據(jù)查詢條件查出并合成語音進行播報,從而大大減少了座席人員的工作負擔。
那么應如何將TTS功能附加到CTI應用中呢?某些比較先進的交換平臺,已經(jīng)在交換機的內部實現(xiàn)了TTS的功能,并作為標準接口的一部分對外提供,業(yè)務開發(fā)商只需要簡單的調用他們即可以在業(yè)務中使用該功能。
對于未實現(xiàn)TTS功能的PBX,就需要業(yè)務開發(fā)商自己去選擇合適的平臺,在此基礎上進行二次開發(fā),即調用所選TTS平臺提供的標準接口,實現(xiàn)語音合成功能。
目前CTI已經(jīng)成為全球發(fā)展最為迅猛的產(chǎn)業(yè)之一,每年以50%的速度增長,CTI如同計算機產(chǎn)業(yè)一樣是一個金字塔形的產(chǎn)業(yè)鏈,從上到下會以至少20倍的幅度增值。TTS作為一種誘人的新技術,如果能很好的嵌入到增值業(yè)務的應用中去,必將形成一個更好的應用前景。
杭州音通軟件有限公司是由國家教育部和浙江省人民政府聯(lián)辦并依托浙江大學而成立的高新技術公司,音通公司主要致力于計算機語音技術的研發(fā)并逐步開拓語音識別、語音流媒體傳輸?shù)绕渌Z音領域的研究。其核心技術(Intone_TTS)是具有自主知識產(chǎn)權的中文語音合成技術,在由浙江省科技廳組織的鑒定中被專家一致鑒定為國內領先地位,并已申請多項國家專利。
Intone_TTS是一套把文本信息轉換為語音信息的開發(fā)工具包,為系統(tǒng)集成商、軟件開發(fā)商提供了完備的接口函數(shù)和編程示例,使用戶能夠靈活的進行調用,并集成到其它應用系統(tǒng)中。接口需要語音合成運行庫的支持,適合多種開發(fā)環(huán)境。開發(fā)者可以根據(jù)具體的應用場合進行選擇。
它能夠對所有的漢字、英文、阿拉伯數(shù)字進行語音合成;
支持繁體字及多音字的編輯;
合成效果:自然、平滑;
規(guī)范的函數(shù)調用接口,同時支持微軟SAPI的調用;支持同步調用和異步調用方式;
支持PCM Wave,uLaw/aLaw Wave,ADPCM,Dialogic Vox等多種語音格式;
支持GB2312碼(簡體中文)、BIG5碼(繁體)、UNICODE碼;
支持多路通道同時合成;
支持Dialogic、東進、三匯等主流語音板卡;
杭州音通軟件公司供稿 CTI論壇編輯