聲網(wǎng)一站式智能語音識別方案升級語音審核“快準省”

2020-04-10 09:48:33 作者：來源：CTI論壇評論：0 　點擊：

　　近日，我們的“一站式智能語音識別方案”將實現(xiàn)升級。升級后，在原有合作伙伴“數(shù)美科技”基礎上，將新增依圖、阿里云這兩家智能語音識別服務商，通過整合行業(yè)TOP3服務商的語音識別技術優(yōu)勢，幫助直播、語音聊天室等互聯(lián)網(wǎng)平臺更智能、高效的識別語音中存在的涉黃、涉政、廣告等不良信息，實現(xiàn)全面、深入地凈化平臺網(wǎng)絡環(huán)境。

　　依圖、阿里云重磅加入，智能語音識別方案升級

　　近年來，隨著直播、短視頻、語音社交等行業(yè)的快速發(fā)展，由用戶創(chuàng)造的UGC內(nèi)容成為了互聯(lián)網(wǎng)內(nèi)容生態(tài)的重要構成，并豐富了人們的互聯(lián)網(wǎng)生活。而另一方面，隨著用戶UGC內(nèi)容越來越多，涉黃、涉政、不良廣告等違法、違規(guī)的內(nèi)容也頻頻出現(xiàn)，成為了“害群之馬”，給很多平臺帶來了風險。同時，相對于圖文和視頻，音頻審核本身在技術上也更具難度，又增加了平臺方的內(nèi)容審核壓力。

　　在去年8月，聲網(wǎng)Agora就推出了“一站式智能語音識別方案”，為企業(yè)提供可集成實時音視頻、實時錄制和實時智能語音識別的一站式服務，在語音識別服務方面接入了數(shù)美科技的“天凈”智能語音審核系統(tǒng)，通過聲紋檢測、語音識別等技術，智能識別語音環(huán)境中的涉黃、涉政、廣告等違法違規(guī)信息，受到了很多企業(yè)的好評。

　　而此次升級后的“一站式智能語音識別方案”新增接入了阿里云、依圖科技先進、智能的語音識別技術，整合了業(yè)界TOP3智能語音識別服務商的技術優(yōu)勢以提供目前互聯(lián)網(wǎng)行業(yè)最全面、最高效的智能語音識別技術。例如，數(shù)美科技的“天凈”智能語音識別，基于深度學習語音識別技術，多維度智能實時審核。深挖場景需求，為直播視頻流、UGC短視頻、FM電臺、語音廣場、語音直播間等各類場景提供智能內(nèi)容過濾服務，通過語音識別轉文本的方式，識別文本內(nèi)容中涉政、色情、廣告等不良信息；業(yè)內(nèi)首創(chuàng)的嬌喘語音識別，基于基于Bi-GRU、Attention模型，精準識別聲音中含有嬌喘、呻吟、耳騷、喊麥等違規(guī)音頻，準確率達到90%以上。聲紋識別與檢索對比”技術可進行聲紋聚類、關聯(lián)，發(fā)現(xiàn)線上、線下語音廣告與欺詐行為等。

　　而依圖科技在公共安全領域早已深耕多年。依靠世界級算法團隊自研的語音識別、自然語言理解和聲紋算法，依圖的“智能語音審核”擁有準、快、省三大特點。準——憑借世界級算法能力加已有場景數(shù)據(jù)的螺旋迭代提升，依圖的召回和準確率居行業(yè)前列，幫企業(yè)最大程度的降低風險�？�——實時監(jiān)測并在3秒內(nèi)返回結果。省——同步返回高精準轉寫文本和違規(guī)音頻片段，幫人工審核員提高效率、節(jié)省時間。

　　打通實時音視頻+智能語音識別+AI，企業(yè)一站式接入

　　聲網(wǎng)Agora的“一站式智能語音識別方案”可為企業(yè)提供實時音視頻+實時錄制+實時智能語音識別的一站式高度集成服務，也是目前唯一一家打通人工智能、實時語音識別、實時音視頻三大技術解決方案的服務商。使用聲網(wǎng)的一站式服務，企業(yè)無需部署額外SDK、無需自己對接CDN廠商、更無需支付拉流成本，就可同時上線直播（實時音視頻）和鑒黃（實時語音識別）功能，幫助企業(yè)大幅節(jié)省接入成本，真正做到一站式方便接入。

　　在智能語音識別方面，聲網(wǎng)Agora整合了業(yè)界TOP3智能語音識別服務商的技術優(yōu)勢。而在實時音視頻功能方面，聲網(wǎng)自建的軟件定義實時網(wǎng)SD-RTN?專為實時音視頻業(yè)務提供SLA/QoS質量保證，能為企業(yè)提供高并發(fā)、高可靠性、低延時和抗弱網(wǎng)等特性的實時音視頻技術。

　　聲網(wǎng)Agora目前在全球擁有250多個數(shù)據(jù)中心。在網(wǎng)絡架構設計上能夠應對10倍以上的負荷，具備千萬級并發(fā)能力。聲網(wǎng)的軟件定義實時網(wǎng)SD-RTN™擁有超低延時特性，可做到全球端到端延時小于400ms，延時中位數(shù)76ms，處于行業(yè)領先水平。聲網(wǎng)還具備優(yōu)秀的弱網(wǎng)傳輸和抗丟包算法，可以在60%的丟包環(huán)境下保障音視頻流暢，70%的網(wǎng)絡丟包環(huán)境下保障語音的流暢。在終端性能和適配方面，聲網(wǎng)針對實時互聯(lián)網(wǎng)lastmile做了深度優(yōu)化，目前已經(jīng)適配6000多款終端設備，網(wǎng)絡覆蓋全球200多個國家和地區(qū)，即使在網(wǎng)絡環(huán)境差的偏遠山區(qū)或跨國場景中用戶也能實現(xiàn)順暢互動。

　　此外，對于語音識別中常見的噪聲、背景音等音質問題，聲網(wǎng)的一站式智能語音識別解決方案還融合聲網(wǎng)Agora語音引擎與AI音頻降噪算法，可提供去除背景音、環(huán)境音之后的高音質音頻源，在原來算法的基礎上將不良信息的識別率有效提高30%以上。

　　通過聲網(wǎng)Agora的“一站式智能語音識別方案”可以幫助企業(yè)嚴格、有效的凈化平臺內(nèi)容質量，降低監(jiān)管風險，提升用戶體驗，同時還能為企業(yè)大幅節(jié)省接入成本。據(jù)了解，接下來聲網(wǎng)還將聯(lián)合更多業(yè)界知名智能語音識別服務商，為企業(yè)持續(xù)提供業(yè)界最高效、最嚴格的內(nèi)容審核機制，促進網(wǎng)絡生態(tài)健康發(fā)展。

【免責聲明】本文僅代表作者本人觀點，與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立，不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考，并請自行承擔全部責任。

相關熱詞搜索：聲網(wǎng) Agora 語音識別

上一篇:中國聯(lián)通與人民網(wǎng)簽署戰(zhàn)略合作協(xié)議共建“智媒平臺”

下一篇:最后一頁