語音技術(shù)新突破,車載應(yīng)用無極限
新一代語音合成引擎語音合成板卡訊飛XF-S4240隆重上市。
2006/02/23
目前,汽車工業(yè)正在逐步發(fā)展成為我國的支柱產(chǎn)業(yè)。
汽車的電子化、智能化和網(wǎng)絡(luò)化趨勢,不僅是這個時代汽車行業(yè)的流行主題,更是我國汽車電子產(chǎn)業(yè)搶占汽車計算平臺制高點,解決產(chǎn)業(yè)"空心化"問題的重要機遇。智能語音技術(shù)在這一革命性進程中有著重要的應(yīng)用價值。
以語音合成、語音識別、語音編解碼為代表的智能語音技術(shù)應(yīng)用在車載領(lǐng)域,通過"變看為聽"的車內(nèi)語音信息服務(wù),"君子動口不動手"的車內(nèi)語音聲控操作,將改變汽車現(xiàn)有的人機信息交流方式,解放出駕駛者的雙手和雙眼,使汽車更具備人性化魅力和個性化特色,提高駕車更安全性。該技術(shù)已引起國內(nèi)外汽車業(yè)界的廣泛關(guān)注,尤其在美國、歐洲、日本等汽車工業(yè)發(fā)達國家,都在不斷加大研究和產(chǎn)業(yè)化的力度。特別是在車載導(dǎo)航領(lǐng)域。
"在可預(yù)見的將來,中國將成為全球衛(wèi)星導(dǎo)航市場的'龍頭老大',其次是印度,然后才是美國和歐洲。"2005年12月初,在上海"國際導(dǎo)航產(chǎn)業(yè)化與科技發(fā)展論壇"中,德國慕尼黑聯(lián)邦國防大學(xué)測地導(dǎo)航研究所所長、美國導(dǎo)航學(xué)會歐洲會員岡特·沃爾夫?qū)ずR蛘f。他補充,這并不僅僅是他一個人的看法,而是全球?qū)Ш筋I(lǐng)域的專家、市場分析人士和公司所達成的共識。
就車載導(dǎo)航而言,截止到2005年底,中國擁有車載導(dǎo)航設(shè)備的車輛不足10萬輛,車載導(dǎo)航安裝率不到2%。而日本的汽車車載導(dǎo)航安裝率高達59%,歐美約占25%。到2007年,中國至少將有60萬輛汽車裝備導(dǎo)航設(shè)備,產(chǎn)值至少超過200億元人民幣。在國外能夠得到極大的普及,與其嵌入式語音技術(shù)等基礎(chǔ)技術(shù)的成熟,為導(dǎo)航設(shè)備帶來了豐富的應(yīng)用服務(wù)是分不開的,比如:實時交通信息播報、當(dāng)前位置的加油站、酒店、商場信息的播報。所以中國車載導(dǎo)航事業(yè)真正要實現(xiàn)跨越式發(fā)展,嵌入式語音技術(shù)的突破是必備的基礎(chǔ)。
據(jù)了解,中科大訊飛公司通過多年的積累,在2005年初推出了新一代語音合成引擎(InterSound KT),其語音效果基本可以達到錄音的效果,并在國內(nèi)外多個廠商的GPS導(dǎo)航系統(tǒng)中得到成功的應(yīng)用,為滿足不同的市場需要,該公司在2006年2月正式推出基于該引擎的XF-S4240語音合成模塊。為整個車載語音的應(yīng)用打下了基礎(chǔ)。正是在這一基礎(chǔ)上,科大訊飛在車載導(dǎo)航領(lǐng)域提出了一系列代表國際先進水平的應(yīng)用方案。
在車載導(dǎo)航領(lǐng)域,傳統(tǒng)的錄音語音導(dǎo)航只能做到簡單的語音內(nèi)容提示,如:"前方100米請往左拐",若要提示"前方100米請往左拐,進入長安街",則無能為力,這是因為千變?nèi)f化的類似路名信息,采用錄音技術(shù)是不現(xiàn)實的。但是在2006年之前,因為語音合成技術(shù)的效果與錄音的差距較大,所以錄音導(dǎo)航設(shè)備仍然占有一定的市場份額。
隨著科大訊飛最新一代語音合成引擎的推出,傳統(tǒng)的錄音方式的語音導(dǎo)航預(yù)計將很快退出市場。因為其語音合成的效果與錄音的效果已經(jīng)基本沒有區(qū)別,并且合成方式的語音導(dǎo)航在代表車載導(dǎo)航設(shè)備發(fā)展方向的信息播報應(yīng)用方面將彰顯更大的優(yōu)勢。
信息播報典型應(yīng)用包括:
區(qū)域信息播報--包括播報當(dāng)前所在位置的各種實用信息(加油站、酒店、商場等)給駕車出行帶來極大的方便。
與無線通訊相結(jié)合可以實現(xiàn):
- 實時交通狀況播報--隨時了解當(dāng)前交通狀況,彌補導(dǎo)航無法發(fā)現(xiàn)的隨時隨地可能發(fā)生的交通擁堵問題;
- 實時新聞播報--及時了解所在位置的最新新聞;
- 天氣預(yù)報播報--了解當(dāng)?shù)靥鞖馇闆r,安排出行;
- 其它如停車/電召信息、110信息等內(nèi)容的播報。
當(dāng)前無線寬帶技術(shù)已經(jīng)成熟,市場也逐漸普及,3G網(wǎng)絡(luò)也預(yù)計將在06年開始進行全國范圍的推廣,這些基本要素的實現(xiàn),加上語音技術(shù)突破,可以預(yù)見內(nèi)容更加豐富的GPS導(dǎo)航服務(wù)將很快到來,為用戶帶來方便,更為中國導(dǎo)航產(chǎn)業(yè)帶來商機。
但是InterSound KT引擎是否能夠適合在當(dāng)前主流的GPS導(dǎo)航設(shè)備中應(yīng)用呢?
據(jù)訊飛公司介紹,其InterSound KT引擎適用性極強,其需要的運算能力與存儲空間,在當(dāng)前主流的GPS導(dǎo)航平臺上都可以提供,產(chǎn)品還具備了:支持男、女雙角色中英文切換,支持拼音輸入、流式文本輸入,支持控制標(biāo)識、合成狀態(tài)輸出等產(chǎn)品特性。
在車載調(diào)度的應(yīng)用中,因為同樣存在錄音方式無法滿足大量變化的信息播報的需要的問題,在語音合成效果與錄音差距較大的時候,使得相當(dāng)一部分車載調(diào)度系統(tǒng)仍然使用錄音方式,從而限制了其服務(wù)內(nèi)容的豐富。在有了訊飛公司最新推出的XF-S4240語音合成板卡后,不僅宣布錄音方式的車載調(diào)度系統(tǒng)即將退出舞臺,同時為部分當(dāng)前已經(jīng)采用合成板卡的車載調(diào)度系統(tǒng)帶來福音。因為該產(chǎn)品兼容原已經(jīng)大量使用的XF-S3231語音合成板卡模塊的軟硬件接口,可實現(xiàn)產(chǎn)品的軟升級(無需開發(fā)),而產(chǎn)品的成本將有較大的降低。(這里不能不說XF-S4240語音合成板卡是一款效果更好、成本更低,考慮周全的好產(chǎn)品,其實際使用效果我們將進一步進行跟蹤報道。)
在合成語音效果得到極大的提高后,XF-S4240語音合成板卡在公交車的報站服務(wù)中也將得到廣泛的應(yīng)用。
當(dāng)我們在上海坐地鐵的時候可能會聽到這樣的報站聲音"徐家匯站到了,前往中國惠普公司、…的乘客請下車",而在下次坐到該站點的時候,他又可能把"惠普公司"改為其它公司的名字,這就是典型的公交報站服務(wù)。這種方式不僅給顧客帶來了方便,同時對需要提高知名度的公司提供了有效的途徑,自然也就成為公交公司有效的增值服務(wù)之一。
在傳統(tǒng)的公交報站中,內(nèi)容是靠錄音的,使得內(nèi)容的變更變得相當(dāng)困難,這也是在幾乎所有的公交車中,公交報站的內(nèi)容幾乎都是不變的原因,在這種情況下,即使經(jīng)常需要的公交車線路的調(diào)整、新增需要的內(nèi)容變更,都是極為不便的。但是在語音合成效果沒有突破之前,硬件的合成產(chǎn)品的效果可能無法滿足公交報站行業(yè)的要求,所以在兩年之前利用語音合成技術(shù)提供公交報站服務(wù)系統(tǒng)基本沒有。
但是在語音合成的效果得到極大的提高后,不僅可以清晰的進行報站服務(wù),還可以極大提高在公交車線路調(diào)整、新增需要的內(nèi)容更新的工作效率,同時也給公交公司的有效增值服務(wù)提供了便利的工具。
科大訊飛公司供稿 CTI論壇編輯
相關(guān)鏈接:
旌德县|
湘潭县|
巴中市|
汉川市|
郸城县|
沙坪坝区|
瑞金市|
屏南县|
合山市|
土默特左旗|
府谷县|
金山区|
南安市|
尉犁县|
柘城县|
宜良县|
鄂托克前旗|
桐乡市|
襄樊市|
当阳市|
广西|
陇南市|
扎兰屯市|
郯城县|
怀仁县|
剑河县|
武义县|
雷山县|
寿光市|
惠水县|
新田县|
涪陵区|
平罗县|
怀远县|
霍州市|
石景山区|
会同县|
丹东市|
江孜县|
夹江县|
彭山县|