中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

您當(dāng)前的位置是:  首頁(yè) > 資訊 > 文章精選 >
 首頁(yè) > 資訊 > 文章精選 >

神州泰岳:無人值守智能客服中心

2017-09-21 16:17:42   作者:   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  由CTI論壇(m.thedanielweber.com)主辦的2017中國(guó)客戶體驗(yàn)創(chuàng)新大會(huì)<http://m.thedanielweber.com/expo/2017/awards2017/index.html>于9月14日在深圳益田威斯汀酒店盛大開幕,本次會(huì)議以"在聯(lián)絡(luò)中心數(shù)字化轉(zhuǎn)型中搶得先機(jī)"為主題,北京神州泰岳軟件股份有限公司AI大數(shù)據(jù)副總裁張瑞飛應(yīng)邀出席此次會(huì)議并發(fā)表題為《無人值守智能客服中心》的主題演講。張瑞飛介紹了泰岳無人客服方案,包括:智能機(jī)器人虛擬坐席,多輪會(huì)話,知識(shí)管理,語音質(zhì)檢,語義質(zhì)檢,場(chǎng)景化應(yīng)用,智能IVR導(dǎo)航,工單機(jī)器學(xué)習(xí),對(duì)接業(yè)務(wù)流程引擎及客服智能運(yùn)維,以及同合作伙伴聯(lián)合打造無人客服生態(tài)。
北京神州泰岳軟件股份有限公司AI大數(shù)據(jù)副總裁張瑞飛
圖:北京神州泰岳軟件股份有限公司AI大數(shù)據(jù)副總裁張瑞飛
演講PPT下載pdf格式
  張瑞飛:大家好!我接下來的半個(gè)小時(shí)給大家介紹一下神州泰岳無人值守的客服中心的解決方案。我們?nèi)斯ぶ悄馨l(fā)展到現(xiàn)在到底有沒有可能形成真正無人值守的客戶中心的方式這是比較有爭(zhēng)議的,最近兩年我們做越來越多的工作,我們看到有越來越多輪工智能的東西在逐漸取代我們比較傳統(tǒng)的用人來實(shí)現(xiàn)的操作。這些內(nèi)容當(dāng)它越來越多的時(shí)候,我們想是不是真的有一天有可能逐漸代替人的10%的工作量,20%,甚至50%的工作量。這樣我們把人工智能技術(shù)的核心結(jié)合其他的流程技術(shù)、數(shù)據(jù)技術(shù),把它合成在一起,跟我們的客服中心的合作伙伴在一起,我們想打造無人值守的客服中心。我們?cè)诮鹑诤投悇?wù)兩個(gè)行業(yè)在進(jìn)行嘗試,我們發(fā)現(xiàn)用人工智能方式做虛擬座席和虛擬服務(wù)窗口的時(shí)候,效率和準(zhǔn)確率超出人們比較繁瑣工作流程的工作限度,減少工作時(shí)間,提高生產(chǎn)效率。
  簡(jiǎn)單介紹參與研究的人員,我們給這些人員做一個(gè)致謝。首先是李生教授,他是咱們國(guó)內(nèi)第一個(gè)獲得國(guó)際ACL國(guó)際語言協(xié)會(huì)的終身成就獎(jiǎng)的第一個(gè)科學(xué)家,是哈工大的黨委書記。也是人工智能研究院的名譽(yù)院長(zhǎng),是我們的首席科學(xué)家。顏永紅教授是Intel做人機(jī)界面的總架構(gòu)師,是中科院的科學(xué)家,主要負(fù)責(zé)語言學(xué)和聲學(xué)研究部分。趙慶衛(wèi)教授是中科院聲學(xué)所的研究員,推出的語音識(shí)別和語音上面具體的應(yīng)用場(chǎng)景。晉耀紅博士是我們?nèi)斯ぶ悄苎芯吭旱脑洪L(zhǎng),是原北京師范大學(xué)的博士生導(dǎo)師,他在語義里面曾經(jīng)參與過HAC概念層次網(wǎng)絡(luò)的語義研究,是當(dāng)時(shí)跟著中科院的團(tuán)隊(duì),是研究組的組長(zhǎng),提出一些不同的概念分詞和語義分局的方法。我們把這個(gè)方法用在現(xiàn)在人工智能平臺(tái)里面,去構(gòu)建OEC平臺(tái)。蔣宏飛博士是原來阿里做訓(xùn)練的訓(xùn)練小組的專家,他在我們這邊負(fù)責(zé)小富機(jī)器人的開發(fā)。這是我們的核心研究團(tuán)隊(duì)。
  無人值守的客服系統(tǒng),傳統(tǒng)的電話服務(wù)和無人值守的智能服務(wù),我們想代替?zhèn)鹘y(tǒng)電話不足的地方,可能是用戶體驗(yàn)和用戶24小時(shí)接聽電話的能力,他的感知和傳統(tǒng)IVR繁瑣的操作,我們想在其中優(yōu)化的地方。我們想做智能客服,但是智能客服和無人值守的客服中心還是有一點(diǎn)不一樣:1、智能客服沒有辦法有效解決口語標(biāo)準(zhǔn)化的問題。2、多輪會(huì)話的場(chǎng)景里面表現(xiàn)不好。3、不能對(duì)復(fù)雜邏輯和復(fù)雜的業(yè)務(wù)流程進(jìn)行有效的診斷。4、缺乏語義糾錯(cuò)的能力。我們講傳統(tǒng)的智能客服只是在以前的客服里面部分注入人工智能的能力,并沒有形成基于人工智能形成判斷和形成虛擬座席的能力。
  我們的設(shè)計(jì)原則:在客服中心問答的時(shí)候,我們想做到一步到位的精確語義理解。在進(jìn)行人機(jī)智能會(huì)話的時(shí)候進(jìn)行自由調(diào)整,人機(jī)會(huì)話,我們?cè)O(shè)想由機(jī)器和人進(jìn)行互動(dòng)和回答問題的時(shí)候,無論問題涉及其他的場(chǎng)景或者這個(gè)問題涉及到要辦的業(yè)務(wù),比如要辦理一個(gè)房貸,買保險(xiǎn)或者申請(qǐng)信用卡,無論什么樣的業(yè)務(wù),我們希望在會(huì)話的過程中進(jìn)行自由跳轉(zhuǎn)。智能問答除了渠道界面,更需要處理業(yè)務(wù)和保留歷史記憶來進(jìn)行多輪會(huì)話的能力,我們?cè)谶@個(gè)能力上取得一定突破,才取得無人客服的概念。
  無人客服并不是我們現(xiàn)在提得很新的話題,京東本身去年的時(shí)候開始嘗試京東無人客服,我們這里講和京東的區(qū)別,我們發(fā)現(xiàn)一些在銀行或者是稅務(wù)或者政府、企業(yè)里面應(yīng)用的企業(yè)級(jí)客服重要需要的,不是消費(fèi)型市場(chǎng)的客服中心需要的東西,比如我們的業(yè)務(wù)流程需要更強(qiáng)的定制,比如我們對(duì)個(gè)人的肖像需要更好的面向企業(yè)的管理,這是企業(yè)里面不同的,我們打造的是面向企業(yè)級(jí)大B的生產(chǎn)端的無人構(gòu)成。技術(shù)架構(gòu),基于文本語義交互式引擎和智能語音交互式引擎,對(duì)語音系統(tǒng)和語義系統(tǒng)分別做解析。智能客服接入網(wǎng)關(guān)對(duì)各個(gè)業(yè)務(wù)進(jìn)行各個(gè)接口,比如銀行,存貸款、理財(cái)?shù)鹊葮I(yè)務(wù)的流程接口。部署架構(gòu),我們通過語音PBX系統(tǒng),進(jìn)入IVR,在IVR對(duì)接無人值守客服系統(tǒng),再生成語音,再和CTI系統(tǒng)進(jìn)行交互。
  這樣的會(huì)話架構(gòu)里面,我們需要能夠進(jìn)行智能交互的引擎結(jié)構(gòu),這個(gè)和傳統(tǒng)機(jī)器人不一樣,我們分五層:知識(shí)學(xué)習(xí)、知識(shí)引擎本身的建設(shè)、問答引擎、對(duì)話引擎、場(chǎng)景引擎,這里面分五層進(jìn)行管理,所以它不再是我們單一的機(jī)器人,只是智能問答的交互引擎,是知識(shí)構(gòu)建到最上層管理的完整功能。具體的組件,包括推薦學(xué)習(xí)、地圖學(xué)習(xí)、閑聊學(xué)習(xí)、場(chǎng)景關(guān)聯(lián)、碎片化的業(yè)務(wù)能力的架構(gòu)和業(yè)務(wù)要素的了解,概念的理解以及會(huì)話歷史和會(huì)話間的記憶,會(huì)話和場(chǎng)景的關(guān)聯(lián)。這里面的能力有這樣幾個(gè):1、我們?nèi)绾芜M(jìn)行相關(guān)意圖的學(xué)習(xí),有時(shí)候我們的人類自然問法背后隱藏的是概念化的語義表示,比如我們說能吃多少吃多少,能吃多少吃多少,重音不同意思不同。這是結(jié)合語音和語義一起做到的。2、知識(shí)加工,如何讓機(jī)器人去學(xué)習(xí)到一個(gè)業(yè)務(wù),我們以前做機(jī)器人智能問答的時(shí)候,有一個(gè)標(biāo)準(zhǔn)問答,對(duì)應(yīng)一些答案,做出擴(kuò)展。一個(gè)標(biāo)準(zhǔn)問對(duì)應(yīng)1200個(gè)擴(kuò)展問,這個(gè)概念在現(xiàn)在的無人值守的客服中心里面可能要顛覆掉,首先不能以問答來理解語義和用戶的業(yè)務(wù)系統(tǒng)。我們要有入口告訴機(jī)器人怎么學(xué)會(huì)業(yè)務(wù)知識(shí),然后我們構(gòu)建業(yè)務(wù)框架的東西,在這上面通過跟機(jī)器人的會(huì)話,首先交給一個(gè)機(jī)器人業(yè)務(wù)知識(shí)。這是傳統(tǒng)給人工座席的培訓(xùn),當(dāng)我的一個(gè)人工座席來的時(shí)候,我應(yīng)該講我的業(yè)務(wù)框架和業(yè)務(wù)要素,以前的機(jī)器人是沒有的,只有問答,這個(gè)不夠,所以把這個(gè)補(bǔ)起來了。3、我們對(duì)概念歸一化的講解,我們?cè)趪L試能不能直接把問題和答案自動(dòng)匹配,在銀行或者在特定的應(yīng)用場(chǎng)景里面,我們讓擴(kuò)展問消失,這樣機(jī)器人維護(hù)過程中,我們就可以基于純粹的人工智能的語義技術(shù)來進(jìn)行維護(hù),這種場(chǎng)景到底可不可能發(fā)生,我們嘗試做這樣的場(chǎng)景。我們也做了測(cè)試,最近在上海銀行,我們做了兩輪:一是帶擴(kuò)展問測(cè)試。二是把所有擴(kuò)展問刪掉的測(cè)試,兩輪測(cè)試效果都很好。4、話題站的管理,話題記憶管理和場(chǎng)景管理,后面分別說。
  整個(gè)構(gòu)成,無人值守的智能客服交互式架構(gòu),從知識(shí)學(xué)習(xí)到線下訓(xùn)練到線上的知識(shí)的發(fā)布,這是完整的框架。
  技術(shù)特色,語音識(shí)別,我們做了幾個(gè)特定功能:1、如何將連續(xù)的語音能夠自動(dòng)轉(zhuǎn)換為文字,這里面主要用到的算法是大家看到的雙向LSTM的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的算法,利用這個(gè)算法我們把這個(gè)速度做到比國(guó)際開源軟件快5倍以上,基于WFST的語音和語音特點(diǎn)和句法進(jìn)行整合的識(shí)別技術(shù)。通過這個(gè)實(shí)現(xiàn)人機(jī)交互和人人交互,準(zhǔn)確率分別是90%和80%,我們?cè)趩闻_(tái)服務(wù)器處理并發(fā)語音。人機(jī)交互是手機(jī)打電話是最常見的人機(jī)交互,我們的語音進(jìn)入到手機(jī),在手機(jī)里面進(jìn)行識(shí)別。人人交互是通過電信的線路來進(jìn)行語音識(shí)別,他們主要的區(qū)別在于對(duì)音質(zhì)的線路損耗和后臺(tái)處理算法的差別。
  2、關(guān)鍵詞的檢索,對(duì)用戶的敏感詞、業(yè)務(wù)詞、提供詞和與說話人無關(guān)的詞,還有支持電話、網(wǎng)絡(luò)和互聯(lián)網(wǎng)的自然語言的對(duì)話來進(jìn)行關(guān)鍵詞的檢索,保證在講話的時(shí)候,第一個(gè)是合規(guī),第二個(gè)是在質(zhì)檢的時(shí)候有些使用。
  3、通過對(duì)語音進(jìn)行語音、語速、輕重音以及語音相關(guān)概念的層次分析,通過層次分析理解基本音頻,以及語調(diào)之間的相關(guān)性,這是基于語音聲學(xué)特征進(jìn)行分析。
  4、場(chǎng)景分割,我能夠去定義語音的角色、場(chǎng)景的背景,可以把語音部分和人的身份去做自動(dòng)的聚類,可以給出客服語音和用戶語音相區(qū)分,即使在這兩個(gè)語音相重疊的時(shí)候,客服正在回答問題,機(jī)器人正在回答問題,你好,請(qǐng)您按照步驟一、步驟二,這時(shí)候打斷,客戶語音進(jìn)來了,他可以分出來客戶的語音是什么、要點(diǎn)是什么,不會(huì)吧兩個(gè)語音疊加在一起,造成含混不清。
  語音引擎突出體現(xiàn)幾個(gè)優(yōu)勢(shì):1、語音的性能優(yōu)勢(shì),首先準(zhǔn)確率上能做到80%和90%,這是語音性能上的優(yōu)勢(shì)。當(dāng)然我們?cè)趯?shí)驗(yàn)室里面有時(shí)候說這不一定是很高的數(shù)據(jù)結(jié)果或者大家都差不多的數(shù)據(jù)結(jié)果,是這樣的。在語音識(shí)別里面,我想大家不會(huì)說哪家的語音識(shí)別的效率會(huì)特別高或者會(huì)特別低,比如科大訊飛特別高或者特別低,都不會(huì)。我覺得關(guān)鍵在于我們是不是有專家在優(yōu)化,給企業(yè)級(jí)或者再一個(gè)領(lǐng)域里面優(yōu)化企業(yè)的使用場(chǎng)景。當(dāng)你的語音引擎在使用場(chǎng)景上進(jìn)行一系列的優(yōu)化之后,它的表現(xiàn)在應(yīng)用里面的差異特別大,這時(shí)候這是語音上面和別人的差別,我們?cè)趹?yīng)用的窄領(lǐng)域內(nèi)去聚焦和投入,去做這樣的語音引擎。
  2、語音的抗噪性,對(duì)于語速的識(shí)別,準(zhǔn)確率和語音的適應(yīng)性上,都做了相關(guān)的學(xué)習(xí)和建模的技術(shù)。
  為了配合無人職守的客服中心,語義上我們做了相關(guān)的提升,主要是三個(gè)方向:1、場(chǎng)景化;、多輪問答。3、業(yè)務(wù)本體建模。說白了是為了使得我們的智能問答的機(jī)器人更接近予人類的操作能力。它除了能夠回答問題以外,它應(yīng)該還能夠去干活,能夠做業(yè)務(wù),能夠進(jìn)行系統(tǒng)的錄入,甚至能夠辦理一些簡(jiǎn)單的業(yè)務(wù)流程或者能夠提示或者能夠進(jìn)行推銷。我們定義不同的業(yè)務(wù)場(chǎng)景,要能基于人類的一個(gè)問題,讓機(jī)器有多輪問答,引導(dǎo)出它整個(gè)問題。第三個(gè)是機(jī)器人要了解業(yè)務(wù),它要進(jìn)行業(yè)務(wù)的建模。
  場(chǎng)景,它等于業(yè)務(wù)框架+知識(shí)類型+交互方式,這就是我們實(shí)際上對(duì)場(chǎng)景基于語義管理的定義。我們知道一個(gè)用戶有不同的業(yè)務(wù)類別,我們可以對(duì)應(yīng)不同的場(chǎng)景。這些業(yè)務(wù)類別對(duì)用戶而言,首先看到的是業(yè)務(wù)框架,對(duì)于學(xué)習(xí)的知識(shí)庫(kù)而言,能夠看到不同的業(yè)務(wù)框架下有不同的知識(shí)類型。在交互方式上也會(huì)看到機(jī)器人給他的表述方式是不同的,這個(gè)我們管它叫場(chǎng)景化。以前的機(jī)器人在過于單一的場(chǎng)景里面使用同一種方式,都是問答。有時(shí)候不是,營(yíng)銷的時(shí)候交互方式是更副文本一點(diǎn),普通的時(shí)候可能交互方式適合簡(jiǎn)單的回答,這樣一方面考慮機(jī)器的復(fù)雜和成本,也使得我們?cè)诓煌瑘?chǎng)景下的使用變得更靈活,不同場(chǎng)景的答案不同。另外,以前過于強(qiáng)調(diào)單一的知識(shí),這里面大家看到的FAQ的知識(shí),像人類一樣,我們有不同的知識(shí),機(jī)器人也應(yīng)該學(xué)習(xí)不同的知識(shí)。等下我舉個(gè)海關(guān)的例子給大家講列表型知識(shí)。通常我們進(jìn)海關(guān),仿真槍能不能帶出海關(guān)?這時(shí)候機(jī)器人給的回答就是整個(gè)法規(guī),一個(gè)海關(guān)的規(guī)范,但實(shí)際上如果人回答那就直接回答仿真槍不能帶出海關(guān)就可以。這句話意思在列表知識(shí)型里面解析,如果以機(jī)器人不具備知識(shí)架構(gòu),永遠(yuǎn)做不到人類這樣回答問題,就不能從列表中解析。這是我們想要求的讓他辦理業(yè)務(wù)或者做場(chǎng)景化所必備不同的知識(shí)能力。這三個(gè)我們叫場(chǎng)景定義。
  場(chǎng)景定義下涉及到建模,定義一個(gè)場(chǎng)景怎么建模,這里面引入BOT建模的方式,通過BOT框架,通過它的底層自帶的概念庫(kù)來滿足機(jī)器人在不同場(chǎng)景下的表現(xiàn)出不同角色的能力,這是BOT概念建模。BOT就是一個(gè)業(yè)務(wù)體系或者一個(gè)圖譜或者就是一個(gè)多維度的業(yè)務(wù)樹,都可以。這是用戶很常見的BOT的拓普?qǐng)D。招商銀行的業(yè)務(wù)劃分,業(yè)務(wù)劃分是像我們培訓(xùn)普通座席一樣,有對(duì)公業(yè)務(wù)、個(gè)人業(yè)務(wù)。對(duì)公業(yè)務(wù)、個(gè)人業(yè)務(wù)再一級(jí)一級(jí)展開。這樣可以告訴他,在機(jī)器的情況下,比如我個(gè)人業(yè)務(wù)里面信用卡,它包括什么,它的知識(shí)要點(diǎn)應(yīng)該包括業(yè)務(wù)流程、業(yè)務(wù)劃分等。機(jī)器人可以在相關(guān)類別情況下進(jìn)行回答,二是它可以去推測(cè)你下一個(gè)問題可能是和什么相關(guān)的,就不會(huì)在所有的問題里面隨意列舉,而是在業(yè)務(wù)框架里面推測(cè),這個(gè)思維是模仿人的思維進(jìn)行的。我們?nèi)嘶卮饐栴}的時(shí)候也是這樣,屬于信用卡類,問了這個(gè),我要找信用卡相關(guān)的,我們?cè)贐OT概念樹的情況下進(jìn)行分析,大家可以列為一個(gè)寬表對(duì)屬性的窮舉,這個(gè)概念展開可以非常寬。這里面列舉了涉及BOT里面很多場(chǎng)景,不一一解釋,它的意義是一樣的。基于這個(gè)我們形成框架庫(kù),我給招商銀行建立BOT場(chǎng)景,我就可以把領(lǐng)域定義為整個(gè)銀行領(lǐng)域,這個(gè)框架我可以定義為銀行哪類業(yè)務(wù)框架,基金辦、概念型知識(shí)或者整個(gè)銀行框架或者信用卡框架,我可以把業(yè)務(wù)領(lǐng)域和業(yè)務(wù)框架定義下來,結(jié)果是我到別的銀行的時(shí)候就可以復(fù)用。比如我到長(zhǎng)沙銀行或者基金管理公司的時(shí)候,我可以把知識(shí)進(jìn)行復(fù)用。基金辦理的框架(見PPT)。
  概念庫(kù),這是業(yè)務(wù)領(lǐng)域常涉及到的場(chǎng)景。這個(gè)概念不單單是以前定義的打語義標(biāo)簽的概念,應(yīng)該還包括里面列舉的,比如它的集合概念、同義概念、業(yè)務(wù)概念、敏感概念、糾錯(cuò)概念、停用概念、成長(zhǎng)概念等,把復(fù)雜的概念進(jìn)行處理,使我們?cè)跇I(yè)務(wù)場(chǎng)景里,能使機(jī)器人應(yīng)答更加靈活,可以更符合我去探訪問題本質(zhì)訴求的能力,我知道它應(yīng)該從屬概念的哪類,看到不同的概念進(jìn)行答案的提取。在這個(gè)基礎(chǔ)上我們?cè)龠M(jìn)行不同類型的知識(shí)加工,比如問答類知識(shí),概念型知識(shí),列表型知識(shí)和要素型知識(shí)等等。不同知識(shí)的特色,這是典型問答型知識(shí),信用卡怎么辦、信用卡如何辦理,這就是問答型知識(shí)。概念型知識(shí),信用卡主要通過訪問什么方式辦理,這里面提取的語義概念要素是信用卡辦理,信用卡辦理的方式、訪問、網(wǎng)點(diǎn)等等,這些要素是被自動(dòng)提取出來,提取出來以后,這句問話變得更加靈活,信用卡怎么辦、信用卡該如何辦理、我該如何辦卡等等,這些內(nèi)容將被列舉成同一條知識(shí)。我們做過一個(gè)測(cè)試,剛才講了銀行里面一個(gè)基本問會(huì)對(duì)應(yīng)1200個(gè)擴(kuò)展問題,通過概念型知識(shí)加工,可以把問題的類別擴(kuò)展類大大縮減,第一步縮減為幾十條,幾十條還不夠,我們希望最后消除擴(kuò)展問,我們拿到適當(dāng)?shù)恼Z料訓(xùn)練之后,最終的目的是消除擴(kuò)展問,讓問題自動(dòng)找答案,或者使用很少的擴(kuò)展問,把機(jī)器人維護(hù)的工作降到最低,對(duì)機(jī)器人有知識(shí)的人知道它的維護(hù)工作有多復(fù)雜,大家看其他銀行上線的機(jī)器人可能就會(huì)有體會(huì)。概念型知識(shí),這是我們自動(dòng)提煉出來的語義概念,信用卡辦理等等。
  要素型知識(shí),典型的是剛才說的賣保險(xiǎn)的問題,我要辦一個(gè)保險(xiǎn)或者買一張火車票等等這樣的問題,后面包含一個(gè)要素,保險(xiǎn)人是誰、年齡是多少、辦什么樣的保險(xiǎn),火車票是從哪兒到哪兒,哪一天,買什么樣的座位、什么等級(jí),這就是要素型知識(shí)。里面避免不了的話題是要給用戶畫他的歷史肖像,以前的行為更喜歡什么樣的,喜歡買一等座還是二等座還是喜歡坐票還是臥鋪,這些是我們要給用戶畫像的能力。這要結(jié)合起來。列表型知識(shí),我們通過對(duì)列表型知識(shí)進(jìn)行加工的時(shí)候,我們可以把機(jī)器人的人機(jī)回答變化一下,例如仿真槍能不能帶上飛機(jī),這里說某某違禁品是違禁品,不可以帶上飛機(jī)。這是從列表知識(shí)里面提取的答案,仿真槍能不能帶上飛機(jī)?他告訴你仿真槍是違禁品,不能帶上飛機(jī)。比如度秘搜索,他會(huì)回答整個(gè)公約,這不是客服想要的答案。
  語義技術(shù)在這方面進(jìn)行增強(qiáng),一是場(chǎng)景化。二是業(yè)務(wù)建模。三是知識(shí)不同表示和知識(shí)加工。四是持續(xù)化的優(yōu)化和服務(wù)的能力。
  我們用了深度學(xué)習(xí)的算法,一是信息抽取和信息發(fā)現(xiàn),主要是用在問題的識(shí)別上。現(xiàn)在的算法主要是兩種,CNN的方式和LSTM的方式,在機(jī)器學(xué)習(xí)上學(xué)習(xí)情感表達(dá)和多輪會(huì)話的能力,這是用LSTM的算法來進(jìn)行提取,它也用在答案自動(dòng)生成和提取上,也用在實(shí)體提取和標(biāo)注上,實(shí)體標(biāo)注上我們對(duì)應(yīng)的CRF等等,還有其他算法的組合。這樣一些算法的提取,包括答案生成,我們用對(duì)抗學(xué)習(xí)的機(jī)制來自動(dòng)模擬人類自然語言生成答案,這樣的算法機(jī)制使我們完成了什么呢?我們說一個(gè)和以前的對(duì)比,以前我們?cè)谧稣Z義標(biāo)簽的時(shí)候,我們自己的引擎是通過傳統(tǒng)的機(jī)器學(xué)習(xí)算法構(gòu)成的,我們做擴(kuò)展的時(shí)候,我們?cè)趺炊甲霾混`活,我們?cè)谏虾cy行實(shí)際測(cè)試的時(shí)候,我們用這樣的算法替掉原來的引擎,做兩種引擎的對(duì)比,在沒有擴(kuò)展論的時(shí)候,機(jī)器應(yīng)答的準(zhǔn)確率和召回效果,和以前維護(hù)標(biāo)準(zhǔn)兩百條擴(kuò)展論問答效果差不多。
  這是學(xué)習(xí)流程,結(jié)合用戶畫像當(dāng)前提問和用戶的歷史提問,把這三個(gè)作為我們判別的數(shù)據(jù)源,通過我們對(duì)問題的處理,包括對(duì)概念的規(guī)劃處理,對(duì)問題的分類,對(duì)信息的識(shí)別,最后拿出一個(gè)結(jié)構(gòu)化的用戶意圖,是用JASON表示的,意味著我們的系統(tǒng)可以開放給所有人,只要用JSON進(jìn)行編程的人,我們可以把引擎的意圖開放給所有咱們?cè)谧南到y(tǒng)。語義識(shí)別的例子,幫我訂一張明天從北京到上海的機(jī)票,最好不經(jīng)常晚點(diǎn)的。我們得出的結(jié)論,這個(gè)人是高大偉,男,36歲,商務(wù)人士,經(jīng)常拜訪客戶,經(jīng)常攜帶藏刀、佛像等禮品。這就是他歷史的畫像,這是我們的數(shù)據(jù)鏈。加上他的問題,我們就輸出這樣的JSON格式,他要做機(jī)票預(yù)定從北京到上海,名字叫高大偉,36歲,商務(wù)認(rèn)識(shí),對(duì)航班準(zhǔn)確率要求高,他要攜帶禮品。我們會(huì)把完整的JSON數(shù)據(jù)發(fā)放出來,可以結(jié)合數(shù)據(jù)源讓機(jī)器人做后臺(tái)的自動(dòng)分析架構(gòu)結(jié)合語義。
  同時(shí)我們考慮對(duì)話棧的技術(shù),像人一樣,人是有記憶的,機(jī)器人回答問題的時(shí)候,最方便的回答是你帶著機(jī)器人和人回答,比如我說,幫我推薦個(gè)信用卡?這個(gè)問題入棧,你問什么幣種、什么職業(yè)。他又說,我想再問一下保險(xiǎn),他把你的問題打斷了,說了一個(gè)其他的問題,機(jī)器人還是可以自動(dòng)問答,你要什么險(xiǎn)種、額度是什么,這個(gè)是話題的入棧,我把話題推到棧里面去。什么時(shí)候話題會(huì)出棧?一是話題中斷。二是話題徹底解決完了。三是話題異常終止或者完美解決。如果不想買,他就知道。接著回到信用卡,他說,請(qǐng)問你什么職業(yè)?這是不是比較接近客服的自然響應(yīng)。我們把話束記憶也加入機(jī)器人的多輪會(huì)話里面去。通過這個(gè)也可以做所謂的引擎算法熱切換,第一種,傳統(tǒng)語義標(biāo)簽的方式,通過語義標(biāo)簽的方式去減少機(jī)器人在語義和句式變化上對(duì)人需求的維護(hù),減少這樣的需求。二是基于深度學(xué)習(xí)的方式,基于深度學(xué)習(xí)的匹配,對(duì)兩類內(nèi)容進(jìn)行匹配,一個(gè)是問題到問題,哪些問題是標(biāo)準(zhǔn)問,哪些是擴(kuò)展問,問題到問題的自動(dòng)匹配。二個(gè)是問題到答案,問題到答案的生成很新,我們正在做這方面的努力,也正在跟招商銀行聯(lián)合做這方面的研究,我們?cè)趺磸膯栴}里面生成答案,這樣我們既希望于最后能夠脫離所有的擴(kuò)展問。
  我們看一個(gè)例子,傳統(tǒng)語義標(biāo)簽的匹配方式,這個(gè)匹配方式做了語義優(yōu)化。比我們以前看到的機(jī)器人好很多,大家可以看到幾年前的機(jī)器人效果比這個(gè)還差。比如我說微信密碼不記得,他回答的方式是我回答不了,小滬功力不足。微信密碼丟了,微信密碼不記得,其實(shí)是一回事。滬是上海銀行實(shí)測(cè)的機(jī)器人,我們把語義標(biāo)簽去掉,換一個(gè)方式,熱切換深度語義,這時(shí)候召回的問題,微信密碼不記得,他會(huì)回答如果忘了微信密碼,我可以推薦知識(shí)。最神奇的是說到微信密碼丟的時(shí)候,還會(huì)推薦相關(guān)的其他類型的知識(shí)。這時(shí)候我們發(fā)現(xiàn)通過深度學(xué)習(xí)可以極大的提升機(jī)器人問題的維護(hù)和回答的能力。
  場(chǎng)景應(yīng)用,語音質(zhì)檢,語義質(zhì)檢,通過聲音質(zhì)檢可能比較常見,語義質(zhì)檢大家可能看到的比較少,但是可以通過文字內(nèi)容理解這個(gè)人的思維,判斷他回答問題的合規(guī)性。潛客挖掘,貴金屬結(jié)算卡在基金理財(cái)上,分別挖掘出不同的潛在的營(yíng)銷客戶。這使呼叫中心從成本中心變成有可能盈利的利潤(rùn)中心。智能投訴管理的場(chǎng)景化應(yīng)用,我們把投訴分成三類76級(jí)別,把它的機(jī)構(gòu)來自于上級(jí)機(jī)構(gòu)的投訴還是有哪些投訴的升級(jí),把投訴分類進(jìn)行劃分。我們把整個(gè)客戶中心的投訴看得非常清楚,我通過一張表,我們叫三元組云圖,可以看到所有投訴里面最真實(shí)的投訴內(nèi)容是什么,而不只是關(guān)鍵字。這是我們有些項(xiàng)目投標(biāo)的時(shí)候正在做的,越來越多的銀行提智能IVR語音導(dǎo)航,我們不再使用關(guān)鍵字,以前的方法是關(guān)鍵字,你可以說關(guān)鍵字,用戶很多時(shí)候不說關(guān)鍵字,他直接希望智能客服來問他,請(qǐng)問有什么可以幫你?他直接說我信用卡丟了怎么掛失,然后你直接跳到菜單里面。這是我們倡導(dǎo)的,我們現(xiàn)在也在投一些銀行的項(xiàng)目,我們也覺得越來越多的銀行用戶直接跟我們講,到底機(jī)器人能替掉人工工作多少的比例,我們?cè)谶@個(gè)方向上一直努力。
  我們希望實(shí)現(xiàn)虛擬座席,我們通過客戶的問題轉(zhuǎn)接到虛擬座席,這個(gè)座席是給他普通座席和權(quán)限的,給他普通數(shù)據(jù)庫(kù)的操作權(quán)限和訪問權(quán)限,以及知識(shí)庫(kù)的訪問權(quán)限。首先它通過小滬機(jī)器人的引擎來做用戶的意圖理解和智能處理,實(shí)時(shí)去辨別知識(shí)類型和場(chǎng)景,同時(shí)也顯示在我們?nèi)说目头钠聊簧希祟惪头梢酝ㄟ^關(guān)鍵字做相應(yīng)的跳轉(zhuǎn),進(jìn)知識(shí)庫(kù)和頁(yè)面。我們把虛擬座席做成人的助理,而且某些情況下對(duì)固定流程、煩瑣的流程、固定的問答方式,虛擬座席可以完全輔助人類化解,而且他們之間可以一鍵進(jìn)行切換,機(jī)器人可以呼叫人,人也可以呼叫機(jī)器人,進(jìn)行場(chǎng)景切換。
  渠道是咱們講的全渠道,不用通過任何渠道,網(wǎng)絡(luò)、短信各種方式。我們最近研究一個(gè)有意思的渠道,通過VR的方式來實(shí)現(xiàn)一個(gè)機(jī)器人的渠道,這里面的場(chǎng)景我通過虛擬座席可以做什么,可以咨詢銀行的業(yè)務(wù),可以進(jìn)行意圖的識(shí)別,做多輪會(huì)話。我可以進(jìn)行營(yíng)銷的主動(dòng)推送,或者推地圖過去告訴你地點(diǎn)在哪里,我可以進(jìn)行各種寒喧、聊天,大家可以在線上找我們的小滬試試,昨天有合作伙伴測(cè)試效果不錯(cuò)。我覺得電影不好看,小滬說我理解您很憤怒。說了一些很有意思的話,這不是你的錯(cuò)什么的。他們寒喧的能力比較強(qiáng)。它也可以做一些超時(shí)的處理,比如時(shí)間過長(zhǎng)的時(shí)候,他可以知道提示電話要斷掉,也可以做無縫轉(zhuǎn)人工和人工和虛擬座席的互轉(zhuǎn),也可以做沒聽清楚問題的提示,也可以做一些幫助。包括用戶的個(gè)人畫像,我們的畫像以前都是在大數(shù)據(jù)平臺(tái)下打數(shù)據(jù)標(biāo)簽做出來的,這里面講的是用戶和實(shí)時(shí)繪畫過程中自然加工出來的,完全不一樣。我們做精準(zhǔn)營(yíng)銷的畫像,大部分來自歷史畫像,但是時(shí)間已經(jīng)過去了,不是現(xiàn)在的用戶行為。今天的用戶行為是正在講話的時(shí)候的畫像,價(jià)值是不一樣的。包括他的知識(shí)點(diǎn)建設(shè)。
  虛擬座席的知識(shí)學(xué)習(xí)怎么做的?你怎么進(jìn)一個(gè)人類知識(shí)告訴他?一是對(duì)現(xiàn)有學(xué)習(xí)知識(shí)學(xué)習(xí)、現(xiàn)有知識(shí)強(qiáng)化、新知識(shí)的發(fā)現(xiàn)。以前的機(jī)器人沒有彈出過界面,我們現(xiàn)在把這個(gè)知識(shí)點(diǎn)可以做到普通人就可以加工和維護(hù)的場(chǎng)景,不需要懂人工智能的專業(yè)知識(shí)。知識(shí)特征我們可以做運(yùn)維統(tǒng)計(jì)。系統(tǒng)的實(shí)施團(tuán)隊(duì),技術(shù)上有三個(gè)團(tuán)隊(duì)負(fù)責(zé),語義建模是張笑然領(lǐng)6個(gè)人的團(tuán)隊(duì),語音訓(xùn)練是劉雪蓮領(lǐng)10個(gè)木團(tuán)隊(duì),接口開發(fā)是張青領(lǐng)20多人團(tuán)隊(duì)來做開發(fā),這是技術(shù)支持和服務(wù)隊(duì)伍。整個(gè)實(shí)施周期如果并行起來,在4-5個(gè)月可以把無人值守的客戶中心建起來。大家看到這里面有些售后,從業(yè)務(wù)調(diào)研開始,然后到知識(shí)庫(kù)的建立,一直到語義理解的系統(tǒng)功能,到鏈條測(cè)試到整體上線,大概是4-5個(gè)月時(shí)間就可以建立整個(gè)系統(tǒng)。這是實(shí)時(shí)服務(wù)體系,我們做的7×24小時(shí)保障。
  案例,長(zhǎng)沙銀行的機(jī)器人在微信和Web客戶端進(jìn)行會(huì)話,這個(gè)機(jī)器人是我們前一個(gè)版本,沒有用深度學(xué)習(xí)的樣例,但是已經(jīng)用了語義標(biāo)簽的樣例,長(zhǎng)沙銀行整個(gè)維護(hù)的時(shí)間和維護(hù)周期非常短,整個(gè)實(shí)施周期控制在2個(gè)月左右的時(shí)間,整個(gè)機(jī)器人的知識(shí)建模已經(jīng)做好。招商銀行智能問答做的測(cè)試,這個(gè)測(cè)試是把小招85萬個(gè)匹配不到的問題做了第二次答案,原來匹配不到的問題,小招一鍵轉(zhuǎn)人工,這時(shí)候有大量人工工作量,后面又放一個(gè)機(jī)器人,發(fā)現(xiàn)85萬個(gè)問題,我們召回60萬個(gè)問題。棘輪是機(jī)器人無法回答的85萬個(gè)問題,通過智能匹配,有60萬個(gè)問題以90%+的準(zhǔn)確率找到了答案。
  我們通過二次匹配進(jìn)行高知性運(yùn)作,通過語義加工和深度學(xué)習(xí)的能力,去減少用戶的人工維護(hù)。智能語音導(dǎo)航也要對(duì)接其他平臺(tái),比如GeneSys、Avaya、華為、中興等等,這是我們做過的一些案例(見PPT)。廣發(fā)做了機(jī)器人的語音質(zhì)檢,大家看一下它的應(yīng)用,廣發(fā)銀行傳統(tǒng)的人工調(diào)取的方法是效率比較低,成本比較高,而且它也面臨很大的壓力,通過上線以后,制止三千個(gè)座席規(guī)模的客服在基于大數(shù)據(jù)的基礎(chǔ)上來實(shí)現(xiàn)自動(dòng)的語音質(zhì)檢。紅色體現(xiàn)出來客戶價(jià)值,我們的覆蓋率可以做到100%,對(duì)于業(yè)務(wù)熱詞可以自動(dòng)統(tǒng)計(jì),自動(dòng)推送培訓(xùn)的內(nèi)容,有95%的合規(guī)內(nèi)容被發(fā)現(xiàn),客服實(shí)時(shí)報(bào)檢是可以做一些分析。現(xiàn)在廣發(fā)也正在做一些關(guān)于語義質(zhì)檢和語義防欺詐的關(guān)聯(lián)分析。比如廣發(fā)辦信用卡的時(shí)候,有很多人寫地址是瞎寫的地址,這個(gè)地址有可能是信用卡的欺詐行為。用常規(guī)的方法很難理解哪個(gè)地址是正確的,哪個(gè)是錯(cuò)誤的,今天的威斯汀也有很多說法,可以說某路某號(hào),也可以說威斯汀酒店,我們通過機(jī)器學(xué)習(xí)的方法來做地址歸一化的校驗(yàn),提出錯(cuò)誤的地址,做防欺詐。重慶的案例,我們想做無人值守的客服中心,光有人工智能不夠。我們應(yīng)該用人工智能的能力連接一切。重慶交委做的例子,我們把數(shù)據(jù)用專門的數(shù)據(jù)平臺(tái)連起來,把業(yè)務(wù)平臺(tái)、開發(fā)平臺(tái)、數(shù)據(jù)平臺(tái)、運(yùn)維平臺(tái)、公共平臺(tái)做起來,整個(gè)做成應(yīng)用服務(wù)平臺(tái),這才是無人值守的客服中心。今天我們重點(diǎn)展開語音和語義兩部分,后面只是給案例的方法給大家展示。
  這是我們實(shí)際做的一些原子服務(wù)和原子組合,這是我們現(xiàn)場(chǎng)做的采訪,做成業(yè)務(wù)圖譜。
  謝謝各位!
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)

伊宁市| 昌乐县| 沂水县| 和静县| 昭通市| 锦屏县| 津市市| 临武县| 奉新县| 葫芦岛市| 商洛市| 昔阳县| 青岛市| 兴山县| 淮北市| 江北区| 遵化市| 镇坪县| 永嘉县| 神农架林区| 和林格尔县| 玉龙| 磐安县| 巩留县| 双柏县| 乌鲁木齐市| 云南省| 常德市| 于田县| 兰溪市| 永登县| 巫溪县| 凤山县| 昭觉县| 六盘水市| 马关县| 徐闻县| 桐城市| 沈阳市| 龙州县| 兴义市|