中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

您當前的位置是:  首頁 > 新聞 > 國際 >
 首頁 > 新聞 > 國際 >

Google更新云端語音轉(zhuǎn)文字服務、聽寫電話出錯率減少54%

2018-04-10 16:47:48   作者:   來源:CTI論壇   評論:0  點擊:


  Cloud Speech-to-Text服務大改版,提供命令與搜尋、電話、影片與預設4種模式,其中強化後的電話模式聽寫電話的錯誤率降低了54%,而與YouTube加上字幕技術(shù)雷同的影片模式轉(zhuǎn)錄錯誤率也降低了64%。
  繼上個月發(fā)表云端文字轉(zhuǎn)語音(Cloud Text-to-Speech)服務之後,Google在周一(4/9)更新了云端語音轉(zhuǎn)文字(Cloud Speech-to-Text)服務,提供全新的影片及電話轉(zhuǎn)錄模型,也新增了自動化標點符號功能。相較於原本的電話模型,新的強化版電話轉(zhuǎn)錄模型(enhanced phone_call model)讓語音辨識的錯誤率減少了54%。
  Google於2016年發(fā)表的Cloud Speech-to-Text原名為Cloud Speech API,可辨識包括中文在內(nèi)的逾120種語言,本周則是該服務建立以來最大規(guī)模的改版,它提供了4種客制化模式,包括命令與搜尋(command_and_search)、電話(phone_call)、影片(video)與預設(default),其中,電話模型適用於基於8khz取樣率記錄的電話內(nèi)容,而預設模型則多用在音質(zhì)較好、時間較長、取樣率高於16khz以上的音頻,使用者可依照不同的使用情境選擇適用的模型,以順利將語音轉(zhuǎn)換成文字。
  Google Cloud AI產(chǎn)品經(jīng)理Dan Aharon表示,有許多云端供應商利用客戶的請求來改善相關(guān)服務,但基於資料及隱私保護的立場,Google并不打算采用這樣的作法,取而代之的是推出業(yè)界首創(chuàng)的「選擇加入計畫」( opt-in program),讓客戶主動提供資料供Google紀錄與分析,而首個成品就是強化版電話轉(zhuǎn)錄模式,該計畫成功地讓Cloud Speech-to-Text的電話轉(zhuǎn)錄服務減少了54%的錯誤。
  至於新的影片模式則可用來將影片中的語音轉(zhuǎn)換成文字,或是轉(zhuǎn)錄同時有多人開講的語音,該模式所使用的機器學習技術(shù)與YouTube自動化字幕背後的技術(shù)雷同,相較於原本的預設模式,影片模式的轉(zhuǎn)錄錯誤率也降低了64%。
  不管是強化版的語音模式或影片模式現(xiàn)在都只支援英文,預計很快就會擴張至其它語言。
  除了全新的語音及影片模式之外,新版的Cloud Speech-to-Text還準備在將語音轉(zhuǎn)成文字之後,自動加入標點符號,以讓文字更容易閱讀,目前該模式仍屬於測試階段,可提供逗點、句號或問號等標點符號的建議。
  除了影片模式每15秒的收費為0.012美元之外,其它模式的費用皆為每15秒0.006美元,為了推廣全新的影片模式,截至今年5月31日可享用每15秒0.006美元的優(yōu)惠價。
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

商城县| 桐庐县| 夏津县| 荔浦县| 盐亭县| 永安市| 通化县| 巩留县| 永泰县| 芷江| 卓资县| 晋宁县| 眉山市| 海南省| 穆棱市| 江源县| 桓台县| 双桥区| 馆陶县| 独山县| 神池县| 南澳县| 巴中市| 龙川县| 临汾市| 余干县| 洛浦县| 万州区| 通江县| 新源县| 尉氏县| 台江县| 嵊州市| 阿坝县| 内丘县| 临高县| 绥阳县| 广灵县| 高邮市| 高雄县| 台山市|