中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

您當前的位置是:  首頁 > 新聞 > 文章精選 >
 首頁 > 新聞 > 文章精選 >

泰岳AI晉耀紅博士:NLP落地需要語言、計算并舉

2018-03-15 10:11:49   作者:   來源:CTI論壇   評論:0  點擊:


晉耀紅
  神州泰岳人工智能研究院院長兼首席科學(xué)家,博士生導(dǎo)師,中國計算機學(xué)會中文信息技術(shù)專委會專委,中國人工智能學(xué)會自然語言處理專委會專委。師從中國自然語言處理著名流派概念層次網(wǎng)絡(luò)(HNC)的創(chuàng)始人黃曾陽教授并于2006年出版專著《HNC(概念層次網(wǎng)絡(luò))語言理解技術(shù)及其應(yīng)用》。國家863十二五課題(2012~2015)“海量文本多層次知識表示及中文文本理解應(yīng)用系統(tǒng)研制”的課題負責(zé)人。
  “NLP是語言與計算結(jié)合的技術(shù)。”
  自然語言處理(NLP)是人工智能和語言學(xué)的一部分,致力于使用計算機理解人類語言中的句子或詞語,實現(xiàn)降低用戶工作量并滿足使用自然語言進行人機交互的目的。
  語法、語義、語用一個都不能少
  晉耀紅博士認為,在現(xiàn)階段自然語言處理存在重計算輕語言的傾向,這是比較片面的。因為NLP的研究對象是語言,所以不能脫離語言談NLP,而必須基于語言知識,同時利用計算機技術(shù)來進行NLP的處理。
  語法的作用
  我打小明。
  狼吃羊。
  網(wǎng)易收購Daydream公司。
  動詞前面的主語是“我”、“狼”、“網(wǎng)易”是動作的發(fā)出者,是施事,主語后的賓語“小明”、“羊”、“Daydream公司”是動作的承受者,是受事。如果顛倒過來,“小明打我”、“羊吃狼”、“Daydream公司收購網(wǎng)易”,那么意思就完全變了。
  語序作為重要的語法手段,規(guī)定了誰是動作的實施者,誰是動作的承受者。
  語義的作用
  小鳥在天空中飛翔。
  白菜在天空中飛翔。
  第一個句子非常自然。而第二個句子雖然符合語法,卻讓人忍不住思考,在什么情況下,白菜才能在天上飛。這是因為“小鳥”在語義平面上具有“飛翔”的功能,而“白菜”不具備此功能。
  語義歧義性是待攻克的難點。
  語用的作用
  有一個程序員出去買東西,妻子跟他說:“買五個桃子回來,要是看見賣西瓜的,就買一個。”結(jié)果他買了一個桃子回來。妻子非常生氣。
  在這個情景里面,妻子的意思是如果看見賣西瓜的,就買五個桃子一個西瓜。而丈夫誤解了妻子的意思。
  誤解的產(chǎn)生及其原因是屬于語用平面的范疇。
  晉博士談到,泰岳AI研究院在此方面投入了大量研究精力,最新推出的非結(jié)構(gòu)化文本大數(shù)據(jù)分析挖掘平臺DINFO-OEC8.0,通過其獨有的專屬語義模型建設(shè)能力,能夠?qū)崿F(xiàn)語義消歧、語義歸一化/概念化,可解決非結(jié)構(gòu)化數(shù)據(jù)處理技術(shù)中語言表達靈活、多樣化的挑戰(zhàn)難題,精準挖掘業(yè)務(wù)語義,提煉非結(jié)構(gòu)化數(shù)據(jù)中業(yè)務(wù)價值信息。
  計算方法是語言知識量化的手段和溝通橋梁
  晉博士認為,除了語言學(xué)知識,要對語言進行全面分析,計算方法也必不可少,我們很長時間內(nèi)以傳統(tǒng)的統(tǒng)計學(xué)習(xí)方法為主,進入21世紀以后,基于詞嵌入的深度學(xué)習(xí)方法進入了人們的視線并且迅速掀起新的浪潮。不同于之前的統(tǒng)計學(xué)習(xí),其訓(xùn)練基于淺層的、高度稀疏的特征,并且高度依賴于人工對特征的選擇。深度學(xué)習(xí)方法是基于密集向量表征做多層級的自動特征表征的學(xué)習(xí),能夠?qū)崿F(xiàn)對特征的自動學(xué)習(xí)。正如DINFO-OEC8.0,我們集成統(tǒng)計學(xué)習(xí)、機器學(xué)習(xí)、深度學(xué)習(xí)等關(guān)鍵自然語言處理技術(shù),針對泰岳自主研發(fā)的專屬語義模型作了進一步創(chuàng)新與改進,集成深度學(xué)習(xí)計算能力,實現(xiàn)平臺對大規(guī)模訓(xùn)練語料的學(xué)習(xí)與預(yù)測。
  晉博士談到,目前在圖像識別領(lǐng)域,深度學(xué)習(xí)的識別準確率達到、甚至超過了人類水平;在語音識別領(lǐng)域,深度學(xué)習(xí)幫助語音識別從實驗室走向了商用。而在NLP領(lǐng)域,深度學(xué)習(xí)的應(yīng)用尚未有重大突破,但在文本分類、命名實體識別、詞義消歧、情感分析、機器翻譯領(lǐng)域,采用深度學(xué)習(xí)的應(yīng)用均超過了當時的最優(yōu)方案,取得了不俗的成績。
  語言與計算的有機結(jié)合是NLP達到實用目標的關(guān)鍵
  在實際應(yīng)用場景中,如客服熱點的自動挖掘、企業(yè)關(guān)聯(lián)圖譜等,NLP的應(yīng)用經(jīng)常是多個任務(wù)協(xié)同處理,共同輸出結(jié)果。如何將語言知識與計算方法有機組織到一起,如何將各個NLP任務(wù)有效結(jié)合,是NLP應(yīng)用達到實用目標的關(guān)鍵所在。
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

都江堰市| 永仁县| 五指山市| 永登县| 易门县| 安图县| 梁河县| 景宁| 桐城市| 子洲县| 乌兰察布市| 延寿县| 曲麻莱县| 拉孜县| 长葛市| 改则县| 新丰县| 尚义县| 长沙县| 浠水县| 洪江市| 巫山县| 仙居县| 贡嘎县| 绩溪县| 新郑市| 大邑县| 金沙县| 西青区| 天等县| 肥乡县| 綦江县| 新竹市| 永泰县| 乌拉特前旗| 贞丰县| 三门峡市| 新蔡县| 会理县| 凭祥市| 图们市|