語音識(shí)別技術(shù)是實(shí)現(xiàn)人機(jī)對話的一項(xiàng)重大突破,在國外近年來發(fā)展得十分迅速,其應(yīng)用也逐步得到了推廣。語音識(shí)別系統(tǒng)利用計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)優(yōu)勢,采用人機(jī)對話方式,人們只要像平常一樣對著話筒說出所需服務(wù)項(xiàng)目,即可輕松獲取自動(dòng)系統(tǒng)提供的信息和服務(wù)。

說起語音識(shí)別技術(shù),大家比較熟悉的是蘋果語音助手Siri、谷歌公司的Googlenow,以及百度語音搜索等個(gè)人終端應(yīng)用產(chǎn)品,但這些公司只能說是語音識(shí)別技術(shù)領(lǐng)域的新貴,Nuance公司才是語音識(shí)別技術(shù)的始祖。Naunce公司曾經(jīng)是語音識(shí)別領(lǐng)域的老大,全球超過80%的語音識(shí)別系統(tǒng)都應(yīng)用過Nuance識(shí)別引擎技術(shù),其語音產(chǎn)品可以支持超過50種語言,在全球擁有超過20億用戶,幾乎壟斷了金融和電信行業(yè),就連蘋果Siri、三星語音助手S-Voice剛開始都是應(yīng)用他們的語音識(shí)別引擎技術(shù)。目前,每天仍有許多人通過撥打基于Nuance公司語音識(shí)別、語言理解和聲紋鑒別技術(shù)的電話,進(jìn)行旅行產(chǎn)品預(yù)訂、股票交易,或與互聯(lián)網(wǎng)系統(tǒng)進(jìn)行交互等。美國航空、聯(lián)邦快遞等公司的呼叫中心也采用了Naunce公司的語音識(shí)別技術(shù)。
但是,隨著技術(shù)的發(fā)展,Naunce公司在專利和算法方面的優(yōu)勢越來越不明顯。語音識(shí)別是機(jī)器智能的重要技術(shù)基礎(chǔ),但一款用戶體驗(yàn)較好的語音識(shí)別系統(tǒng),在很大程度上依靠數(shù)據(jù)和經(jīng)驗(yàn),特別是神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)技術(shù)的發(fā)展使得數(shù)據(jù)和經(jīng)驗(yàn)方面的積累更為重要。因此,自進(jìn)入21世紀(jì)以來,蘋果、谷歌、三星等IT巨頭越發(fā)重視人工智能領(lǐng)域的發(fā)展,Naunce公司在語音識(shí)別技術(shù)方面的領(lǐng)先優(yōu)勢逐步縮小。谷歌等公司不僅收購了在語音識(shí)別技術(shù)領(lǐng)域有領(lǐng)先優(yōu)勢的中小公司,在技術(shù)研發(fā)上投入了巨額資金,而且花費(fèi)重金從Naunce公司挖走了大量技術(shù)人才,其中包括在2004年挖走Nuance聯(lián)合創(chuàng)始人邁克·科恩,讓他出任谷歌公司的語音技術(shù)總監(jiān)。蘋果Siri也不是蘋果公司自己研發(fā)的技術(shù),而是2010年收購的Siri Inc。公司的產(chǎn)品。2011年,蘋果公司便將該技術(shù)融入iPhone 4S并推出了Siri語音助理應(yīng)用程序。其在此后的多個(gè)版本中逐步升級優(yōu)化,利用超過2.45億個(gè)短語的識(shí)別輔助理解上下文,以增強(qiáng)語境識(shí)別能力。
當(dāng)然,語音識(shí)別技術(shù)領(lǐng)域不能不提的是軟件巨頭微軟公司。目前,微軟公司有兩款機(jī)器智能的終端產(chǎn)品,分別是微軟小娜Cortana和微軟小冰。Cortana是微軟推出的第一款個(gè)人應(yīng)用輔助智能程序,是微軟公司在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域的首次嘗試。它可以記錄用戶的日常使用行為和使用習(xí)慣,利用云計(jì)算、搜索引擎和非結(jié)構(gòu)化數(shù)據(jù)分析,讀取和學(xué)習(xí)文本文件、電子郵件、圖片、視頻等數(shù)據(jù),理解用戶的語義和語境,從而更好地實(shí)現(xiàn)人機(jī)交互。微軟小冰是由微軟Bing搜索中國團(tuán)隊(duì)開發(fā)的一款跨平臺(tái)人工智能聊天機(jī)器人,用戶可在新浪微博、微信、米聊等平臺(tái)上與其進(jìn)行智能對話。此外,微軟小冰還兼具群提醒、百科、天氣、星座、笑話、交通指南、餐飲點(diǎn)評等實(shí)用技能。