中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

 首頁(yè) > 技術(shù) > 技術(shù)文摘 > 語(yǔ)音識(shí)別前景如何?

語(yǔ)音識(shí)別前景如何?

1999-12-06 00:00:00   作者:   來源:   評(píng)論:0 點(diǎn)擊:


  鄭方,1967年生于江蘇省,獲清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)學(xué)士、碩士及博士學(xué)位。現(xiàn)為清華大學(xué)副教授,清華-adidsp技術(shù)研究中心主任及語(yǔ)音實(shí)驗(yàn)室主任。鄭方作為主要承擔(dān)者或負(fù)責(zé)人參與了許多語(yǔ)音識(shí)別領(lǐng)域的國(guó)家重點(diǎn)攻關(guān)項(xiàng)目和863高科技項(xiàng)目并多次獲獎(jiǎng)。另外,他還負(fù)責(zé)開發(fā)了若干基于ti和adi的dsp語(yǔ)音識(shí)別產(chǎn)品。他的專業(yè)興趣包括信號(hào)處理,聲學(xué)/語(yǔ)言模型建模,孤立詞/連續(xù)語(yǔ)音識(shí)別,關(guān)鍵詞檢出,語(yǔ)音聽寫,語(yǔ)言理解等。現(xiàn)為ieee會(huì)員,中國(guó)《中文信息學(xué)報(bào)》編委。他已發(fā)表40余篇有關(guān)語(yǔ)音處理的學(xué)術(shù)論文,其中數(shù)篇獲獎(jiǎng)。



  語(yǔ)音識(shí)別雖然已經(jīng)有比較大的進(jìn)步,但必須有大的創(chuàng)新才可能有大的突破。主要包括以下幾個(gè)方面:

  1.提高系統(tǒng)魯棒性和自適應(yīng)能力,包括語(yǔ)音特征提取、聲學(xué)模型、語(yǔ)言模型等諸多方面的魯棒性和自適應(yīng)等。

  語(yǔ)音的特征提取和聲學(xué)模型對(duì)含噪語(yǔ)音、不同信道傳輸施加給語(yǔ)音的影響、不同發(fā)音人及其不同方式等要有魯棒性和自適應(yīng)能力;語(yǔ)言模型對(duì)各種不同的應(yīng)用領(lǐng)域要有魯棒性和自適應(yīng)能力。

  2.在語(yǔ)音識(shí)別中使用語(yǔ)音學(xué)知識(shí)和語(yǔ)言學(xué)知識(shí)。語(yǔ)音模型的建立仍然是一個(gè)基本問題,但對(duì)什么樣的發(fā)音建什么樣的模型就不僅是數(shù)學(xué)建模的問題,還需把語(yǔ)音知識(shí)和語(yǔ)言知識(shí)結(jié)合起來,以高層知識(shí)作為建模和識(shí)別的引導(dǎo)。這些知識(shí)不管在聲學(xué)模型部分還是在語(yǔ)言模型部分都應(yīng)該盡可能應(yīng)用。

  3.重視海量語(yǔ)音庫(kù)和語(yǔ)料庫(kù)的制作和標(biāo)注。語(yǔ)音庫(kù)用以訓(xùn)練語(yǔ)音模型,語(yǔ)料庫(kù)則用以訓(xùn)練統(tǒng)計(jì)語(yǔ)言模型,它們的制作和標(biāo)注有著舉足輕重的地位。一個(gè)海量的、科學(xué)標(biāo)注了的語(yǔ)音庫(kù)和語(yǔ)料庫(kù)對(duì)提高聲學(xué)模型和語(yǔ)言模型是非常重要的。

  4.策略型和多模態(tài)方案。在目前的技術(shù)還不是特別成熟的前提下,可能需要綜合利用各種已有技術(shù)來提高系統(tǒng)的整體性能。比如充分利用各種可以利用的特征、集成各種識(shí)別性能互補(bǔ)的若干識(shí)別器、結(jié)合語(yǔ)音識(shí)別和手寫體文字識(shí)別,為用戶提供各種不同應(yīng)用的方案。這些都是有益的解決方案。

  5.窄帶應(yīng)用和口語(yǔ)對(duì)話應(yīng)用。語(yǔ)音聽寫機(jī)之所以不能很好推廣,也許是因?yàn)槟壳坝胁簧俪錾臐h字輸入方法,如全拼、雙拼、五筆等。但是有些場(chǎng)合,如通過帶寬很窄的電話線對(duì)遠(yuǎn)程的數(shù)據(jù)庫(kù)進(jìn)行信息檢索和查詢(如天氣預(yù)報(bào)、旅游信息、股市行情、航班信息等)時(shí),語(yǔ)音識(shí)別就會(huì)發(fā)揮很大的作用,從而會(huì)有很大的應(yīng)用前景。這是因?yàn)椋Z(yǔ)音是非常自然的方式,而且由于電話上只有數(shù)字鍵,相對(duì)于用數(shù)字鍵進(jìn)行逐級(jí)的需求確認(rèn)來說,語(yǔ)音識(shí)別更具有競(jìng)爭(zhēng)力。

  在這種應(yīng)用中,需要解決的技術(shù)難點(diǎn)包括:(一)由于電話信道帶寬窄(只有3.4khz),語(yǔ)音信號(hào)的信息損失較大,電話機(jī)和信道質(zhì)量差異大,背景噪音和信道噪音種類繁多,因此必須有性能優(yōu)異的語(yǔ)音增強(qiáng)、特征提取、語(yǔ)音識(shí)別與理解等算法。(二)由于說話人的在查詢時(shí)使用的都是自然語(yǔ)言,因此必須研究口語(yǔ)現(xiàn)象。(三)必須研究語(yǔ)言理解技術(shù)。聽寫機(jī)只能解決語(yǔ)音到文本的轉(zhuǎn)換,卻不知其意;但口語(yǔ)對(duì)話系統(tǒng)必須有語(yǔ)言理解部分才能知道用戶的查詢需求,并有針對(duì)性地提供相應(yīng)的信息。

  6.制定軟件開發(fā)工具(sdk)。為了推廣語(yǔ)音產(chǎn)品,制定方便中間開發(fā)人員使用sdk也非常重要。一些知名公司無不在此傾注力量,以期制定工業(yè)標(biāo)準(zhǔn)。如ibm的ibm sdk、微軟的microsoft sapi、dragon公司的dragon sdk、以及l(fā)&h公司的spark等都是用于開發(fā)語(yǔ)音產(chǎn)品的軟件開發(fā)工具。這也是國(guó)內(nèi)研發(fā)機(jī)構(gòu)需要學(xué)習(xí)和注意的地方。

得意音通公司供稿 原文《中國(guó)計(jì)算機(jī)報(bào)》,第91期,1999年12月6日

相關(guān)熱詞搜索:

上一篇:第一頁(yè)

下一篇:采用IP傳真提供增強(qiáng)型傳真服務(wù)

相關(guān)閱讀:

分享到: 收藏

專題

德令哈市| 遂昌县| 基隆市| 建德市| 五常市| 平原县| 集安市| 巴彦县| 高尔夫| 桃园市| 丽水市| 仲巴县| 景宁| 永兴县| 云梦县| 合江县| 遵义县| 徐汇区| 新兴县| 蒙阴县| 洛隆县| 黔江区| 晋江市| 老河口市| 武穴市| 北流市| 全南县| 克山县| 甘肃省| 陈巴尔虎旗| 南充市| 永福县| 遵义县| 新河县| 新野县| 炎陵县| 商城县| 当雄县| 安丘市| 佛教| 阳原县|