解放雙手 車載語(yǔ)音導(dǎo)航時(shí)代來(lái)臨
2009/06/30
題記:中國(guó)汽車保有量迅速增加,中國(guó)導(dǎo)航設(shè)備普及率近年來(lái)雖持續(xù)快速增加,但相對(duì)于汽車總保有量來(lái)說(shuō),比例依然很低,遠(yuǎn)低于歐美25%、日本
59%的普及率,發(fā)展空間極大。中國(guó)地大物博、交通情況復(fù)雜的特點(diǎn)也決定了導(dǎo)航設(shè)備在中國(guó)的應(yīng)用更具必要性與現(xiàn)實(shí)意義,且中國(guó)導(dǎo)航產(chǎn)品具有突出的性價(jià)比優(yōu)
勢(shì)。語(yǔ)音技術(shù)與導(dǎo)航設(shè)備的結(jié)合是大勢(shì)所趨,既是用戶實(shí)際需求,又是導(dǎo)航產(chǎn)品的必然發(fā)展方向,市場(chǎng)空間極為廣闊。那么什么是語(yǔ)音技術(shù)?語(yǔ)音技術(shù)的發(fā)展現(xiàn)狀怎
樣?它到底是如何與導(dǎo)航產(chǎn)品結(jié)合的?它將給未來(lái)的汽車帶來(lái)哪些價(jià)值?
語(yǔ)音導(dǎo)航國(guó)際發(fā)展趨勢(shì)
從全球汽車產(chǎn)業(yè)發(fā)展?fàn)顩r來(lái)看,語(yǔ)音技術(shù)在車載導(dǎo)航中的應(yīng)用是一種新的趨勢(shì)。傳統(tǒng)的車載導(dǎo)航產(chǎn)品,是用眼睛看的方式獲取相關(guān)信息,對(duì)汽車駕駛者而言存在一定的安全隱患。因此,基于廣大汽車駕駛者安全性、舒適性考慮,將語(yǔ)音技術(shù)應(yīng)用于導(dǎo)航領(lǐng)域是必然趨勢(shì)。
語(yǔ)音技術(shù)在車載導(dǎo)航中的應(yīng)用已成為國(guó)際汽車發(fā)展的必然趨勢(shì),這將真正實(shí)現(xiàn)人機(jī)語(yǔ)音交互。目前,雷克薩斯采用了來(lái)自Voice
Box Technologies公司的語(yǔ)音識(shí)別(VR)解決方案。奧迪也正在專注于改善其語(yǔ)音識(shí)別,并推出了新的升級(jí)版軟件來(lái)更新其MMI,使其變得更加用戶友
好。同時(shí),更多整車廠也在為車載導(dǎo)航產(chǎn)品積極尋求適合的語(yǔ)音技術(shù)解決方案。
國(guó)際上每年都有舉辦“Blizzard Challenge”比賽,它是國(guó)際英文語(yǔ)音合成研發(fā)領(lǐng)域最高級(jí)別的賽事,參賽單位包括中國(guó)的科大訊飛、美國(guó)麻省理工學(xué)院(MIT)、卡耐基-梅隆大學(xué)
(CMU)、IBM 研究院、微軟研究院、英國(guó)愛(ài)丁堡大學(xué)、日本ATR(國(guó)際電氣通信基礎(chǔ)技術(shù)研究所)等國(guó)際一流的語(yǔ)音研究機(jī)構(gòu),在一起既同場(chǎng)競(jìng)技,又共同交流技術(shù)。
在不遠(yuǎn)的將來(lái),語(yǔ)音車載導(dǎo)航技術(shù)的以及整車語(yǔ)音技術(shù)的應(yīng)用水平,將成為衡量高端車型的一個(gè)重要標(biāo)準(zhǔn)。在更長(zhǎng)遠(yuǎn)的時(shí)間里,語(yǔ)音技術(shù)在汽車上的應(yīng)用將更為普遍,成為汽車的一項(xiàng)基本配置和功能。
語(yǔ)音導(dǎo)航國(guó)內(nèi)發(fā)展?fàn)顩r
目前,國(guó)內(nèi)汽車制造廠商就語(yǔ)音技術(shù)在車載導(dǎo)航中的應(yīng)用已經(jīng)達(dá)成了廣泛的共識(shí),都在積極尋求語(yǔ)音技術(shù)提供商。與此同時(shí),汽車制造廠商在尋求合作伙伴的時(shí)候從長(zhǎng)遠(yuǎn)發(fā)展角度考慮,重點(diǎn)關(guān)注語(yǔ)音技術(shù)提供商的綜合實(shí)力,要求技術(shù)供應(yīng)商具有從語(yǔ)音合成到語(yǔ)音識(shí)別的全面技術(shù)領(lǐng)先。
當(dāng)前,將車載導(dǎo)航設(shè)備與語(yǔ)音技術(shù)結(jié)合,也成為了各廠商普遍關(guān)注的增加產(chǎn)品亮點(diǎn)和競(jìng)爭(zhēng)力的一條重要途徑。
對(duì)于車載導(dǎo)航來(lái)說(shuō),有了語(yǔ)音合成,無(wú)論是千變?nèi)f化的道路名稱,還是隨時(shí)到來(lái)的路況信息,都能隨時(shí)播報(bào);有了語(yǔ)音識(shí)別,目的地設(shè)定、路況信息查
詢,只需說(shuō)出命令即可完成操作。“合成+識(shí)別”的理念和解決方案,真正實(shí)現(xiàn)了交互式的語(yǔ)音導(dǎo)航系統(tǒng),從根本上解決了安全隱患,提升了汽車駕駛樂(lè)趣。
目前國(guó)內(nèi)已推出的具有語(yǔ)音功能的導(dǎo)航產(chǎn)品中絕大部分應(yīng)用的都是科大訊飛的語(yǔ)音合成技術(shù),實(shí)現(xiàn)信息語(yǔ)音播報(bào)、語(yǔ)音操作提示等功能,并對(duì)于語(yǔ)音識(shí)別技術(shù)在導(dǎo)航產(chǎn)品中的應(yīng)用與廠商共同合作進(jìn)行預(yù)研和應(yīng)用探討。
據(jù)了解,在國(guó)內(nèi)做語(yǔ)音導(dǎo)航研究的有多家公司,其中科大訊飛在中文語(yǔ)音合成、語(yǔ)音識(shí)別、口語(yǔ)評(píng)測(cè)等多項(xiàng)技術(shù)上擁有國(guó)際領(lǐng)先的成果。語(yǔ)音導(dǎo)航在車載
領(lǐng)域的應(yīng)用上,當(dāng)關(guān)閉車窗的情況下,只要是普通話或與普通話相近的方言,科大訊飛語(yǔ)音一次性識(shí)別正確率都可以達(dá)到90%以上。此外,語(yǔ)音識(shí)別功能的成本已
經(jīng)大大降低,加入的硬件和軟件授權(quán)費(fèi)都在廠商和用戶的接受范圍之內(nèi),與語(yǔ)音車載導(dǎo)航的高性能、高附加值相比,可以說(shuō)微不足道。
語(yǔ)音導(dǎo)航的車載價(jià)值
最大價(jià)值表現(xiàn)在:以語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)音編解碼為方向的智能語(yǔ)音技術(shù)應(yīng)用在車載領(lǐng)域,將改變汽車現(xiàn)有的人機(jī)信息交流方式,解放駕駛者的雙手和雙眼,使汽車具備更人性化魅力,體現(xiàn)個(gè)性化特色,提高駕車安全性。
未來(lái),語(yǔ)音技術(shù)將會(huì)在車載中得到更大更廣泛的應(yīng)用,通過(guò)“變看為聽(tīng)”的車內(nèi)語(yǔ)音信息服務(wù),“君子動(dòng)口不動(dòng)手”的車內(nèi)語(yǔ)音聲控操作,隨意調(diào)節(jié)車內(nèi)
溫度、亮度等,使汽車操作更具人性化、趣味性,使駕駛者真正實(shí)現(xiàn)“易車生活”,將為汽車工業(yè)的發(fā)展帶來(lái)一場(chǎng)真正的革命。目前,隨著中國(guó)汽車工業(yè)的快速發(fā)展
和汽車保有量的增加,汽車消費(fèi)者對(duì)于汽車性能提出了更高的要求,電子化、智能化和網(wǎng)絡(luò)化趨勢(shì)已成為當(dāng)前汽車行業(yè)的流行主題,語(yǔ)音技術(shù)在汽車領(lǐng)域中的應(yīng)用空
間十分廣闊。
同時(shí),智能語(yǔ)音技術(shù)在車載導(dǎo)航設(shè)備上的應(yīng)用,亦對(duì)整個(gè)產(chǎn)業(yè)鏈的拓展、發(fā)展具有重要意義,提供了新的、廣闊的增值空間。
語(yǔ)音導(dǎo)航如何應(yīng)用到車載
語(yǔ)音識(shí)別技術(shù)的引用對(duì)硬件設(shè)備及軟件系統(tǒng)的支持能力會(huì)有更高的要求:
其一,在硬件配合上,需要更高性能的處理器,區(qū)別于一般性能的高品質(zhì)麥克風(fēng)和適合錄音數(shù)據(jù)傳送的音頻電路,以此來(lái)保證識(shí)別引擎接受數(shù)據(jù)的完整性和可用性;
其二,在導(dǎo)航軟件上,需要軟件開(kāi)發(fā)商在搜索引擎的接口中加入便于語(yǔ)音識(shí)別系統(tǒng)可以調(diào)用的數(shù)據(jù)和命令菜單,以此來(lái)實(shí)現(xiàn)分類信息搜索、POI搜索和交叉路口搜索等功能。
語(yǔ)音導(dǎo)航應(yīng)用的難題
語(yǔ)音技術(shù)在車載導(dǎo)航中應(yīng)用的技術(shù)難點(diǎn)可從語(yǔ)音合成、語(yǔ)音識(shí)別兩方面來(lái)看。
語(yǔ)音合成方面,技術(shù)難點(diǎn)即在于語(yǔ)音合成的技術(shù)水平與質(zhì)量。語(yǔ)音識(shí)別方面的技術(shù)難點(diǎn)主要表現(xiàn)在對(duì)眾多口音和方言的支持、對(duì)車內(nèi)噪音環(huán)境的適應(yīng)和處理,以及命令中關(guān)鍵詞的提取上。
中國(guó)地大物博,方言有幾千種,部分方言與普通話差別甚大,基于標(biāo)準(zhǔn)普通話的語(yǔ)音識(shí)別系統(tǒng)在識(shí)別帶有方言口音的普通話時(shí),識(shí)別率會(huì)下降很多。
對(duì)于中文語(yǔ)音識(shí)別應(yīng)用中經(jīng)常面臨的方言口音、復(fù)雜信道和背景噪聲等問(wèn)題,依據(jù)從實(shí)際業(yè)務(wù)系統(tǒng)中收集的涵蓋不同方言和不同環(huán)境噪聲的海量語(yǔ)音數(shù)據(jù),采用最新的區(qū)分性訓(xùn)練方法進(jìn)行語(yǔ)音建模,從而使語(yǔ)音識(shí)別產(chǎn)品在復(fù)雜應(yīng)用環(huán)境下可以擁有良好的一致性效果表現(xiàn)。
“隨意說(shuō)”的難點(diǎn)在于核心命令詞的提取、語(yǔ)意分析。該技術(shù)使用戶可以自如地以自然語(yǔ)言與智能語(yǔ)音信息服務(wù)系統(tǒng)進(jìn)行交互,經(jīng)過(guò)引擎的自然語(yǔ)意分析理解而得到用戶的意圖,再反饋給用戶對(duì)應(yīng)的需求信息,從而引導(dǎo)用戶達(dá)到其預(yù)想的目標(biāo)。
另外,在車輛使用過(guò)程中,發(fā)送機(jī)的運(yùn)轉(zhuǎn)聲、空調(diào)噪音、窗外環(huán)境的噪聲和風(fēng)噪等各類噪音會(huì)對(duì)車內(nèi)的語(yǔ)音識(shí)別效果形成一定的影響。總而言之,解決應(yīng)用技術(shù)難點(diǎn)的核心在于語(yǔ)音技術(shù)供應(yīng)商在核心技術(shù)、語(yǔ)音資源庫(kù)等方面的長(zhǎng)期積累、研究。
在國(guó)內(nèi),一直在智能語(yǔ)音技術(shù)較為領(lǐng)先的科大訊飛公司,通過(guò)多年的研究積累了大量的方言數(shù)據(jù)庫(kù),語(yǔ)音合成技術(shù)已經(jīng)達(dá)到不僅能生成標(biāo)準(zhǔn)流暢的普通話,而且可以支持四川話、河南話、湖南話、東北話等幾乎全部的主流方言。
語(yǔ)音導(dǎo)航如何操作?
兩個(gè)前提:第一,需要導(dǎo)航軟件廠商將車載設(shè)備可以支持的命令詞內(nèi)容信息告知用戶(這些內(nèi)容可能是在導(dǎo)航菜單界面的功能名稱,也可能是用戶自行設(shè)
置的目的地名稱及手機(jī)聯(lián)系人的名稱等);第二,車載設(shè)備商可以在方向盤(pán)或車載導(dǎo)航儀上安裝一個(gè)語(yǔ)音識(shí)別啟動(dòng)按鍵,通過(guò)按動(dòng)識(shí)別鍵啟動(dòng)語(yǔ)音控制系統(tǒng),用戶對(duì)
著識(shí)別麥克說(shuō)出自己的需求,系統(tǒng)通過(guò)識(shí)別用戶的語(yǔ)言,實(shí)現(xiàn)用戶的需求。
在實(shí)際使用中,如用戶需要導(dǎo)航儀尋找當(dāng)前所在位置附近的加油站,按動(dòng)識(shí)別鍵后直接對(duì)著麥克風(fēng)說(shuō)“導(dǎo)航到附近加油站”,導(dǎo)航儀會(huì)將搜索到的附近加油站的位置和具體信息通過(guò)圖形顯示和語(yǔ)音回饋給用戶。
當(dāng)用戶需要查詢某一位置時(shí)可以說(shuō)出此POI的名稱,如“家樂(lè)福超市”,識(shí)別系統(tǒng)便會(huì)結(jié)合搜索引擎按照由近至遠(yuǎn)的方式為用戶列出附近的家樂(lè)福超市的位置信息;另外,用戶也可以說(shuō)出希望去往的某個(gè)交叉路口的名稱,如“深南大道和農(nóng)林路交叉口”等找到目的地。
隨著智能語(yǔ)音識(shí)別技術(shù)的不斷完善,數(shù)據(jù)資源的不斷積累,用戶可以不拘于固定的語(yǔ)言表達(dá)方式而用較為自然的語(yǔ)音進(jìn)行命令輸入,如“導(dǎo)航到某某地”這樣的命令也可以說(shuō)成“我想去某某地”、“某某地在哪”或“帶我去某某地”等多種表述方式,語(yǔ)音系統(tǒng)都可以正確識(shí)別并處理。
語(yǔ)音導(dǎo)航其它應(yīng)用
語(yǔ)音識(shí)別技術(shù)在車載影音娛樂(lè)、通信系統(tǒng)、舒適系統(tǒng)中得到了更廣泛的應(yīng)用,語(yǔ)音技術(shù)將進(jìn)一步增強(qiáng)汽車的安全與舒適性能。
語(yǔ)音系統(tǒng)可以實(shí)現(xiàn)CD、MP3、收音機(jī)功能控制,也可以實(shí)現(xiàn)語(yǔ)音點(diǎn)歌搜索:用戶只要說(shuō)出歌手或歌曲名稱,或者哼唱一段歌詞,車載MP3就會(huì)搜索
到你想要聽(tīng)的音樂(lè)。通信方面,車載設(shè)備通過(guò)藍(lán)牙與手機(jī)連接后,只要對(duì)其說(shuō)出人名或號(hào)碼,手機(jī)就會(huì)進(jìn)行自動(dòng)撥號(hào)。另外,通過(guò)聲控可以實(shí)現(xiàn)車內(nèi)溫度、亮度等調(diào)
節(jié),使駕駛者能夠真正享受到車內(nèi)舒適生活。除了語(yǔ)音識(shí)別技術(shù),語(yǔ)音合成系統(tǒng)可以實(shí)現(xiàn)對(duì)汽車油量、電量、胎壓以及速度的播報(bào)及聲控結(jié)果的反饋確認(rèn)等。
基于汽車的安全性能考慮,對(duì)車載的功能進(jìn)行控制沒(méi)有復(fù)雜的操作程序,只需要通過(guò)開(kāi)口說(shuō)話就可以解決。另外,針對(duì)在車內(nèi)環(huán)境的智能語(yǔ)音應(yīng)用場(chǎng)景,
也會(huì)設(shè)計(jì)一整套語(yǔ)音交互的流程方案,更加方便用戶接受和使用。在語(yǔ)音識(shí)別引擎獲得用戶命令到正確反饋信息的時(shí)間是相當(dāng)短暫的,以毫秒計(jì)算,這個(gè)過(guò)程完全不
會(huì)影響到用戶的使用。
未來(lái),語(yǔ)音系統(tǒng)將成為車載內(nèi)信息獲取、互動(dòng)娛樂(lè)、程序操控的重要工具,真正成為車載設(shè)備綜合控制終端,解放駕駛者的雙手,為改善行車安全、提升車載娛樂(lè)價(jià)值、促進(jìn)車載信息化發(fā)揮舉足輕重的作用。
CTI論壇編輯
相關(guān)鏈接:
奉化市|
商南县|
噶尔县|
台湾省|
厦门市|
昌都县|
晋城|
黄陵县|
福建省|
镇巴县|
浙江省|
德化县|
五华县|
磐石市|
会宁县|
黎平县|
屯门区|
繁峙县|
花垣县|
黄浦区|
蓬莱市|
惠安县|
奎屯市|
平定县|
朝阳市|
安吉县|
翁源县|
高要市|
巫山县|
德阳市|
安庆市|
玉树县|
宁海县|
邯郸县|
马关县|
成安县|
东辽县|
甘泉县|
得荣县|
云南省|
高雄市|