會議中,需要做各種會議記錄的你,是否還在為面前普通話與地方方言不斷切換而一籌莫展?
工作中,需要整理錄音的你,是否會為冗長的信息、模糊的發(fā)音而心煩不已?
生活中,你是否還在為對著語音輸入法一不小心就帶出口的方言無法被識別而煩惱?
這一切都將不復存在,靈云語音識別技術(shù),聽懂你的方言,也幫你聽懂別人的方言、民族語和外語,而且支持混合識別,并以字幕、投屏等多種形式展示。
二十年核心技術(shù)匠心研發(fā),完善的產(chǎn)學研合作體系,深厚的行業(yè)案例積累,使得靈云語音識別技術(shù)持續(xù)保持行業(yè)領(lǐng)先。定制的專用語音識別模型和多樣化、大容量的語料訓練,滿足不同行業(yè)客戶需求。
在聲學模型方面,通過采集大量真實錄音數(shù)據(jù),對不同方言、語種發(fā)音習慣,如兒化音、聲調(diào)等,進行學習訓練,提高模型精度和識別率。
在語言模型方面,靈云語音識別技術(shù)通過對各地方言、語種的特有詞匯,如四川方言中的“巴適”、“安逸得板”、“莫得”等,進行專門訓練,有效提升了語音識別引擎對口音、詞匯的適配能力。
基于行業(yè)領(lǐng)先的端到端技術(shù),靈云語音識別簡化了多語種情況下不同語言的特定發(fā)音詞典、語言模型等方面的問題,在降低模型訓練的復雜度基礎上,進一步提升了語音識別的準確率。
在政企會議、高峰論壇、研討會等場景,書記員通常面臨很大的文字記錄工作量,面對跨語種交流,僅能通過翻譯提供單語會議紀要,且無法在事后進行回聽校正。基于多語種語音識別技術(shù),捷通華聲推出了一系列行業(yè)解決方案。

會議過程中,無論發(fā)言人說的是中文還是英文,無論是普通話還是地方方言,靈云智會系統(tǒng)都能對這些發(fā)言分角色進行識別轉(zhuǎn)寫,快速生成會議紀要。

同時支持將識別內(nèi)容以字幕或投屏形式展現(xiàn)出來,與演講PPT相結(jié)合,幫助與會嘉賓更好的獲取和理解專家所分享的內(nèi)容。
同樣的,在公檢法審訊、紀檢談話等場景,無論是實時記錄還是延時記錄,對于記錄員來說都是一項艱巨的任務。靈云智錄問訊系統(tǒng),能夠自動區(qū)分發(fā)言人角色,在被問訊人說方言或其他語種情況下,也能夠準確識別,快速生成審訊記錄,加快辦案效率,為記錄員減負。
在客服中心,靈云實時坐席輔助系統(tǒng)能夠精準轉(zhuǎn)寫客戶與坐席通話,以文字形式直接在電腦桌面展示出來,并支持業(yè)務話術(shù)輔助功能,幫助坐席人員準確理解客戶需求,提供高質(zhì)量服務。

最新推出靈云聽語——一款語音轉(zhuǎn)文字應用,支持實時將聲音轉(zhuǎn)為文字和離線音頻轉(zhuǎn)寫,具備中、英、數(shù)字混合識別,自動打標點、智能分段、時間戳等功能,使轉(zhuǎn)寫文字清晰易讀,受到記者、政府公務員、白領(lǐng)、教師和學生的一致歡迎。
開發(fā)者也可通過靈云平臺(AIcloud.com)快速調(diào)用靈云話語音識別能力,快速開發(fā)出支持不同發(fā)言和語種語音識別的各種應用,為不同行業(yè)、不同地區(qū)用戶提供更貼心的服務。
目前,靈云語音識別已經(jīng)支持四川話,上海話,閩南話、粵語等多種方言,維、蒙、藏(安多、康巴、衛(wèi)藏)、彝、朝等少數(shù)民族語,英、法、德、日、韓、阿拉伯語等多語種識別,并保持行業(yè)領(lǐng)先的高識別準確率。
未來,捷通華聲將結(jié)合行業(yè)和地方需求,繼續(xù)開放更多方言和語種識別能力,通過與合作伙伴優(yōu)勢互補,共同推動人工智能產(chǎn)業(yè)健康發(fā)展,為更多人帶來便利。