首頁(yè) > 資訊 > 國(guó)內(nèi) >

思必馳DUI標(biāo)注訓(xùn)練一體化平臺(tái)全場(chǎng)景應(yīng)用，識(shí)別體驗(yàn)持續(xù)提升！

2021-03-31 09:15:30 作者：來(lái)源：CTI論壇評(píng)論：0 　點(diǎn)擊：

　　“有些人稱(chēng)其為人工智能，但現(xiàn)實(shí)是這種科技會(huì)提升我們。因此，我認(rèn)為這種科技不是人工智能，而是增強(qiáng)我們的智能。”

　　-Ginni Rometty

　　“07---讀洞拐”

　　“什么是皰疹---什么是PORT”

　　“導(dǎo)航去fu南電視臺(tái)---導(dǎo)航去湖南電視臺(tái)”

　　“介個(gè)東西是我的---這個(gè)東西是我的”

　　人機(jī)自由交流的前景是漫長(zhǎng)而漸進(jìn)的，語(yǔ)音識(shí)別技術(shù)在細(xì)分場(chǎng)景持續(xù)落地，需要“因地制宜”提升識(shí)別效果。

　　語(yǔ)音識(shí)別的“三大考驗(yàn)”

　　噪聲環(huán)境。目前對(duì)語(yǔ)音識(shí)別效果影響最大的就是環(huán)境雜音或噪音，在公共場(chǎng)所中，來(lái)自四面八方的聲音會(huì)讓識(shí)別系統(tǒng)不知所措，實(shí)驗(yàn)室環(huán)境下的優(yōu)異表現(xiàn)可能在實(shí)際應(yīng)用場(chǎng)景中被“吊打”。例如在高鐵、地鐵、公交等交通場(chǎng)景下，多種混合噪聲降低了識(shí)別效果，進(jìn)而影響用戶(hù)在詢(xún)路、購(gòu)票、換乘過(guò)程中的交互體驗(yàn)。

　　專(zhuān)業(yè)術(shù)語(yǔ)。大多數(shù)垂直應(yīng)用場(chǎng)景都有自身的專(zhuān)業(yè)術(shù)語(yǔ)和指代用詞，例如醫(yī)療場(chǎng)景中病癥、醫(yī)藥名，門(mén)店銷(xiāo)售場(chǎng)景中的奢侈品牌名稱(chēng)、型號(hào)，公安審訊場(chǎng)景中的敏感詞匯，會(huì)議場(chǎng)景中的人名、地名等等，要求語(yǔ)音系統(tǒng)適應(yīng)各種領(lǐng)域，還能準(zhǔn)確識(shí)別特殊用詞不是件容易事。

　　多語(yǔ)言混合識(shí)別。“你好小馳，hu（福）建今天天氣怎么樣？那fu（湖）南呢？”識(shí)別方言口音在生活中隨處可見(jiàn)，伴隨著AI技術(shù)拓展到了三、四線城市，智慧門(mén)店、地產(chǎn)售樓、汽車(chē)4S店等場(chǎng)景的應(yīng)用都重在“入鄉(xiāng)隨俗”。此外，中英混雜、多語(yǔ)種等語(yǔ)言習(xí)慣也影響著識(shí)別效果。

　　場(chǎng)景驅(qū)動(dòng)，定制模型提升識(shí)別率

　　思必馳推出DUI標(biāo)注訓(xùn)練一體化平臺(tái)是集成語(yǔ)音標(biāo)注、模型自訓(xùn)練、識(shí)別測(cè)試、服務(wù)部署和團(tuán)隊(duì)管理于一體的一站式產(chǎn)品，提供數(shù)據(jù)標(biāo)注-模型優(yōu)化-測(cè)試評(píng)估-服務(wù)部署完整鏈路語(yǔ)音識(shí)別自主優(yōu)化能力，支持私有化部署，協(xié)助企業(yè)在短期內(nèi)實(shí)現(xiàn)識(shí)別效果“不可用->可用”的提升，實(shí)現(xiàn)快速更新響應(yīng)，持續(xù)提升場(chǎng)景識(shí)別效果。

　　目前，思必馳DUI標(biāo)注訓(xùn)練一體化平臺(tái)，已在醫(yī)療、政務(wù)、航空等多個(gè)行業(yè)領(lǐng)域得到應(yīng)用。平臺(tái)支持私有云一鍵化部署，未來(lái)也將以公有云的形式對(duì)外開(kāi)放，用于語(yǔ)音識(shí)別優(yōu)化。注冊(cè)用戶(hù)可全流程自主掌握，后續(xù)規(guī)模化的拓展也將觸類(lèi)旁通。

　　會(huì)議場(chǎng)景：

　　會(huì)議記錄更細(xì)致

　　會(huì)議發(fā)言的實(shí)時(shí)轉(zhuǎn)寫(xiě)、糾錯(cuò)與記錄是現(xiàn)代辦公的強(qiáng)需求。會(huì)議場(chǎng)景下的需求可以歸納為兩方面：

　　1.準(zhǔn)確度高，即識(shí)別結(jié)果要準(zhǔn)。行業(yè)領(lǐng)域常用語(yǔ)、專(zhuān)有名詞、中英文混雜、人名職位等各種詞匯篇章表述需要盡可能準(zhǔn)確。借助平臺(tái)進(jìn)行語(yǔ)言和熱詞模型的訓(xùn)練，訓(xùn)練后的模型在會(huì)議真實(shí)場(chǎng)景下的識(shí)別率提升至95%以上。另外，使用語(yǔ)言模型增量訓(xùn)練模式，通過(guò)反復(fù)迭代，可以增強(qiáng)在某一個(gè)細(xì)分場(chǎng)景或領(lǐng)域下的識(shí)別效果。除此以外，大會(huì)場(chǎng)景下，可以針對(duì)領(lǐng)導(dǎo)發(fā)言人的用語(yǔ)習(xí)慣進(jìn)行聲學(xué)定制，系統(tǒng)持續(xù)自我“進(jìn)化”，模型將越用越智能。

　　2.閱讀性強(qiáng)，即識(shí)別出的文本易于閱讀，可懂度高。會(huì)議轉(zhuǎn)寫(xiě)結(jié)果通常會(huì)是篇章段落，且多含有口語(yǔ)化表達(dá)，因此識(shí)別結(jié)果要通俗易懂，尤其在標(biāo)點(diǎn)斷句上要“通人性”。通過(guò)平臺(tái)的標(biāo)點(diǎn)、順滑、斷句模型訓(xùn)練可以輸出符合眾人閱讀習(xí)慣的文本。

　　航空通訊場(chǎng)景：

　　語(yǔ)音質(zhì)檢更安全

　　航空通訊比通用場(chǎng)景復(fù)雜，除存在諸多QNH（海平面氣壓）類(lèi)似的縮寫(xiě)詞匯、專(zhuān)業(yè)術(shù)語(yǔ)外，斷句、發(fā)音方式1(幺)、2(兩)、7(拐)、0(洞)等，也比較特殊。只有精準(zhǔn)識(shí)別座艙內(nèi)飛行員之間、或與地面塔臺(tái)間的溝通話術(shù)，才可有效確保飛行安全。用戶(hù)通過(guò)DUI標(biāo)注訓(xùn)練一體化平臺(tái)可進(jìn)行語(yǔ)言+聲學(xué)+標(biāo)點(diǎn)的自訓(xùn)練，實(shí)現(xiàn)標(biāo)點(diǎn)斷句自動(dòng)化全量質(zhì)檢，降低了人工成本，提升溝通效率，保障飛行安全。在已有落地案例中，實(shí)現(xiàn)了識(shí)別準(zhǔn)確率相對(duì)提升40%。

　　醫(yī)療場(chǎng)景：

　　專(zhuān)業(yè)術(shù)語(yǔ)更精準(zhǔn)

　　醫(yī)療場(chǎng)景的應(yīng)用不僅面臨器械噪聲、候診人群說(shuō)話聲等背景噪聲，還面臨著專(zhuān)業(yè)科室、專(zhuān)家名、病癥等專(zhuān)業(yè)術(shù)語(yǔ)，例如，“血壓150毫米汞柱“、“推XXMg液體”。語(yǔ)音識(shí)別的準(zhǔn)確性關(guān)乎診斷結(jié)果的正確輸出。DUI標(biāo)注訓(xùn)練一體化平臺(tái)模型在對(duì)詞匯、語(yǔ)句、發(fā)音優(yōu)化后，實(shí)現(xiàn)識(shí)別準(zhǔn)確率相對(duì)提升40%，在醫(yī)療垂直領(lǐng)域下的效果更佳。平臺(tái)的私有化部署，可將患者隱私存儲(chǔ)在醫(yī)院自建機(jī)房中，確保數(shù)據(jù)安全。

　　城市交通：

　　風(fēng)暴降噪更清晰

　　風(fēng)噪、路噪、發(fā)動(dòng)機(jī)噪聲等多重環(huán)境噪音是城市交通場(chǎng)景應(yīng)用的一大難題。DUI標(biāo)注訓(xùn)練一體化平臺(tái)通過(guò)思必馳VDCNN自研算法降噪，針對(duì)交通場(chǎng)景深度學(xué)習(xí)，在嘈雜環(huán)境下也能耳聽(tīng)八方。同時(shí)，支持普通話/中英混合/英語(yǔ)/粵川滬等多語(yǔ)種及方言的識(shí)別，“入鄉(xiāng)隨俗”準(zhǔn)確識(shí)別“??(lei)崗站、“東涌(chong)站”等冷門(mén)、多音字的站名，讓乘客通過(guò)咨詢(xún)機(jī)進(jìn)行語(yǔ)音問(wèn)詢(xún)、購(gòu)票更自由。

　　數(shù)字化門(mén)店：

　　消費(fèi)者服務(wù)更個(gè)性

　　在各類(lèi)門(mén)店中，服務(wù)人員可佩戴著藍(lán)牙耳麥、智能錄音工牌與客戶(hù)交談，AI輔助服務(wù)行業(yè)數(shù)字化轉(zhuǎn)型。

　　例如在地產(chǎn)售樓場(chǎng)景中，精細(xì)化語(yǔ)音識(shí)別效果，強(qiáng)化對(duì)方言口音、“預(yù)算”、“產(chǎn)權(quán)”等行業(yè)關(guān)鍵詞的識(shí)別。餐飲店內(nèi)，記錄下最受歡迎的“菜品名”。汽車(chē)4S店中，通過(guò)對(duì)“排放量”、“品牌名”、等高頻詞匯識(shí)別，進(jìn)行用戶(hù)畫(huà)像分析。不僅可以規(guī)范員工的服務(wù)話術(shù)，更能基于大數(shù)據(jù)洞察用戶(hù)需求，給出針對(duì)性方案提升簽單轉(zhuǎn)化率。

　　語(yǔ)音識(shí)別優(yōu)化是一個(gè)漫長(zhǎng)的過(guò)程，伴隨海量數(shù)據(jù)不斷更新，語(yǔ)音識(shí)別準(zhǔn)確率將持續(xù)提升。

　　智能經(jīng)濟(jì)形態(tài)下，以AI為技術(shù)手段，賦能產(chǎn)業(yè)形態(tài)轉(zhuǎn)型升級(jí)是思必馳所愿。將自主定制的主動(dòng)權(quán)交給用戶(hù)，讓智能語(yǔ)音交互技術(shù)持續(xù)下沉，賦予各行業(yè)投入智能化浪潮的自由權(quán)利，或許智能化故事才剛剛開(kāi)始。

【免責(zé)聲明】本文僅代表作者本人觀點(diǎn)，與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立，不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考，并請(qǐng)自行承擔(dān)全部責(zé)任。

相關(guān)熱詞搜索：思必馳 DUI 標(biāo)注訓(xùn)練一體化平臺(tái)

上一篇:華為與汾酒簽署戰(zhàn)略合作協(xié)議，共同建設(shè)“智慧汾酒”

下一篇:最后一頁(yè)

相關(guān)閱讀：