你可能不知道Nuance是做什么的,但你一定知道iPhone 4S帶來的一項(xiàng)革 命性的人機(jī)交互產(chǎn)品——“Siri”。事實(shí)上,為“Siri”提供語音數(shù)據(jù)庫支持的正是Nuance,此前曾用過一段時(shí)間Vlingo的平臺(tái)。
作為全球領(lǐng)先的語音和語言解決方案提供商,Nuance因?yàn)槭荰9輸入法的擁有者被業(yè)界所熟知,目前全球90%以上的手機(jī)都采用T9輸入法,這個(gè)輸入法原本是一家名為“Tegic Communications”所開發(fā),后來被Nuance買了下來。Nuance同時(shí)也在近期收購(gòu)了滑動(dòng)輸入法的公司Swype。
關(guān)鍵的數(shù)據(jù)收集
近日Nuance在深圳舉行了“2012年Nuance移動(dòng)論壇”,這家以往“隱身”于各大國(guó)際公司背后的企業(yè)出現(xiàn)在了國(guó)內(nèi),吸引了深圳諸多廠商的興趣。Nuance在會(huì)上展示了三段不同的Video,這三段Video其中就有大家所熟知的Siri的廣告片,另外一段則是Nuance自己的“聲龍”系列產(chǎn)品,最后一段則是將語音技術(shù)結(jié)合手勢(shì)控制應(yīng)用到智能電視的場(chǎng)景。通過短片,Nuance不但展示了目前語音技術(shù)發(fā)展的最新動(dòng)態(tài)和趨勢(shì),同時(shí)也展示了諸多國(guó)際企業(yè)所重視的關(guān)鍵點(diǎn)——用戶體驗(yàn),這將是在未來企業(yè)競(jìng)爭(zhēng)中取勝的殺手锏。而Nuance的目標(biāo),也就是幫助這些企業(yè)提高用戶體驗(yàn)。

語音技術(shù)的出現(xiàn)顯著改變了人機(jī)互動(dòng)的方式,但如果你對(duì)Siri有一定的研究,你會(huì)發(fā)現(xiàn)其實(shí)語音識(shí)別技術(shù)(ASR)只占到其中的20%,真正重要的則是語義識(shí)別技術(shù)。語義識(shí)別能幫助用戶更準(zhǔn)確地能否搜索出想要的結(jié)果。這種技術(shù)基于Statistic Language model(語言模型統(tǒng)計(jì)),需要大量的數(shù)據(jù)來完善搜索的結(jié)果。同時(shí)對(duì)于自然語言的理解(NLU技術(shù)),也需要數(shù)據(jù)庫的數(shù)據(jù),來進(jìn)行語法的收集。“越多的數(shù)據(jù),越容易幫助我們配對(duì)用戶所需要的內(nèi)容,了解用戶的意圖,將意圖翻譯成行動(dòng),效果最終也是取決于本身數(shù)據(jù)的質(zhì)量。”Nuance大中華區(qū)總經(jīng)理鄭裕慶表示。
Nuance的Dragon Go憑借在美國(guó)的Apple App Store和Android Market兩大移動(dòng)應(yīng)用平臺(tái)巨大的下載量而被用戶熟知。Dragon Go將Nuance的聲龍語音識(shí)別和自然語言理解技術(shù)與人工智能技術(shù)相結(jié)合,從而顯著簡(jiǎn)化了搜索移動(dòng)內(nèi)容的體驗(yàn)。因此,用戶僅憑借語音便能得到他們想要的內(nèi)容,并能將更多的時(shí)間用于瀏覽而非查找在線內(nèi)容。也就是說,Dragon Go能聽懂用戶說的話并能理解用戶意圖。用戶僅需說出一個(gè)簡(jiǎn)單的短語,他們所喜愛和最相關(guān)的內(nèi)容提供商便會(huì)顯示在眼前,用戶能輕松地獲取餐廳評(píng)述、購(gòu)買電影票、觀看流媒體電影和電視節(jié)目、在線購(gòu)物、查找方向、聽喜愛的音樂、還可以通過Expedia預(yù)定酒店。
如何提供更好的用戶體驗(yàn)?
據(jù)了解,目前Nuance主要采用兩種商業(yè)模式。一種是直接向OEM廠商和制造廠商提供語音技術(shù)和解決方案,同時(shí)收取授權(quán)費(fèi)用。這里不僅包括了手機(jī)、TV、PC等消費(fèi)電子產(chǎn)品,還包括大量的企業(yè)級(jí)行業(yè)應(yīng)用。另一方面,Nuance提供了自主研發(fā)的產(chǎn)品“如Dragon go”,供智能手機(jī)用戶方便的在AppStore以及Android Market免費(fèi)下載。通過向消費(fèi)者提供免費(fèi)下載使用,Nuance得以收集龐大的語音數(shù)據(jù),從而對(duì)語音引擎進(jìn)行訓(xùn)練,從而提高引擎的準(zhǔn)確度。
“我們的DragonDictation(聲龍聽寫)和DragonSearch(聲龍搜索)這兩個(gè)應(yīng)用,是比蘋果的Siri出來還要早,就是因?yàn)槲覀円茸銮捌谕度耄挥惺占诉@個(gè)數(shù)據(jù)庫,才能提高產(chǎn)品體驗(yàn)。”鄭裕慶表示,數(shù)據(jù)庫的豐富程度會(huì)直接影響到語音和語義的辨識(shí)度。所以Nuance早在1999年就已經(jīng)開始在PC上應(yīng)用語音引擎,到目前為止已經(jīng)更新了11個(gè)版本,可以說是一個(gè)非常成熟的引擎。
“除了成熟的引擎,我們最大的優(yōu)勢(shì),其實(shí)是如何能把用戶體驗(yàn)做得更好的經(jīng)驗(yàn)。事實(shí)上語音識(shí)別率已經(jīng)不是目前最重要的因素了,因?yàn)榇蠹铱赡懿罹喽疾惶蟆5怯脩趔w驗(yàn)就不一樣了。”鄭裕慶表示,包括如何解決噪音問題、如何優(yōu)化語音控制界面,這些提高用戶體驗(yàn)的東西,Nuance有著豐富的經(jīng)驗(yàn)以及完善的解決方案。
據(jù)統(tǒng)計(jì),2011年通過云端訪問Nuance的語音數(shù)據(jù)庫便有20億的訪問量。而據(jù)鄭裕慶介紹,Nuance目前已經(jīng)跟不少國(guó)際知名的品牌進(jìn)行了合作。其中就包括三星智能電視,以及BMW汽車。而在今天年年初,Nuance也發(fā)布了跟Intel的合作,未來Nuance將為Urtrabook提供語音服務(wù),包括開啟軟件、寫email、更新社群網(wǎng)站、控制音樂播放等操作都可通過語音完成。
電子工程專輯
相關(guān)熱詞搜索:
相關(guān)閱讀: