你是否有因為英語發(fā)音不準,導致語音翻譯、語音轉(zhuǎn)文字等情況下錯誤率高的問題?

隨著人工智能技術(shù)的不斷進步,社會數(shù)字化轉(zhuǎn)型步伐加快,AI的觸角逐漸深入到各個場景,語音識別作為作為人機交互的核心技術(shù),已經(jīng)在生活生產(chǎn)中得到廣泛應用。其中,英語作為最具影響力的全球性交流語言之一,在世界范圍內(nèi)使用率都極高,但是由于中英文混合的復雜性和語種的差異性,給英語語音識別的準確率帶來了極大挑戰(zhàn)。
近日,基于智能語音領(lǐng)域多年的技術(shù)沉淀,標貝科技推出英語語音識別功能,讓客戶在不同的場景下,都能享受到更快速、更準確的英語語音識別服務(wù)。
01/精準識別
此次標貝科技英語語音識別的最大亮點是,通過大量英語語料數(shù)據(jù)(中式、英式、美式;兒童、青少年、成人;朗讀與對話),不斷對識別模型進行優(yōu)化訓練,從而讓語音識別準確率獲得大幅提升,英語語音識別詞準率高達95%。
02/即輸即轉(zhuǎn)
在線實時轉(zhuǎn)寫速度快,隨著用戶講話,語音內(nèi)容即可實時、準確的呈現(xiàn)出來,識別結(jié)果響應時間低于300毫秒,快速的系統(tǒng)響應,讓信息溝通變得無比順暢,提升用戶交互體驗。
03/識文斷句
可以針對用戶輸入上下文進行智能糾錯,語境判斷,智能化斷句插入標點符號,適用于不同場景下的美式英語、中式英語識別,幫助用戶隨心應手的實現(xiàn)轉(zhuǎn)寫錄入。
標貝語音技術(shù)負責人表示,受復雜的外部因素影響,如噪聲、多人對話、含糊不清的口音等都給語音識別造成影響,一旦識別錯誤就可能改變整句話的意思。標貝科技基于AI技術(shù)及語言深度研究的積累,采用基于wordpiece建模的端到端系統(tǒng)和動態(tài)解碼器技術(shù)融合的產(chǎn)品化的服務(wù)端識別系統(tǒng),可實現(xiàn)大詞匯量連續(xù)的英語語音識別、指令詞識別,整體識別速度和準確率可以滿足多種語音交互場景的個性化需求。

目前,標貝科技已經(jīng)建立豐富英文識別數(shù)據(jù)庫,如美式英文朗讀與對話數(shù)據(jù)庫、英式英語數(shù)據(jù)庫、中國成人說英文數(shù)據(jù)庫、中國青少年英文數(shù)據(jù)、兒童英文數(shù)據(jù)庫等,發(fā)音方式包括中式、英式、美式三種,且覆蓋兒童,青少年,成人全年齡段。

*以上數(shù)據(jù)庫列表僅為部分內(nèi)容,如需完整數(shù)據(jù)庫請聯(lián)系我們
結(jié)合中文識別能力,標貝中英文語音識別將帶來更多應用落地,例如,智能客服場景下,將坐席大量的錄音文件轉(zhuǎn)寫成文字,幫助質(zhì)檢和服務(wù)提升;視頻直播場景中實時將發(fā)音人的聲音轉(zhuǎn)換成文字,自動輸出對應字幕上屏;AI在線教育中,精準識別學生的英語口語發(fā)音、表達能力并進行分析,快速提高口語能力。
從“中文、方言識別”到“中英文混搭自由說”,從“實時在線識別”到“錄音離線識別”,標貝科技一直致力于為用戶帶來更智能的語音識別技術(shù)與服務(wù)。未來,當智能語音交互成為日常主流,應用場景更加廣泛,標貝科技將繼續(xù)加碼研發(fā)投入,驅(qū)動語音識別技術(shù)繼續(xù)升級迭代,創(chuàng)造更加智能化的語音交互體驗。