為了解決身份認(rèn)證問題,生物特征識(shí)別技術(shù)被認(rèn)為是解決方案的未來之星。但是,近期有關(guān)指紋、人臉和虹膜等分別被假冒攻擊的報(bào)道讓人有些擔(dān)憂。2016年,西班牙巴塞羅那舉辦了MWC2016世界移動(dòng)通信大會(huì),在會(huì)上《華爾街日?qǐng)?bào)》記者利用軟膠模輕松解鎖iPhone指紋密碼;2016年,美國(guó)斯坦福大學(xué)研發(fā)的人臉跟蹤軟件Face2Face攻破“人臉”識(shí)別;2015年,著名的混沌計(jì)算機(jī)俱樂部的安全研究員Jan Starbug接受采訪時(shí)稱僅需用通過谷歌搜索找到的高清晰度圖像,就可以使用一些虹膜掃描工具進(jìn)行攻擊……科研工作人員投入大量精力研究活體檢測(cè)技術(shù)以對(duì)抗這些攻擊,并且取得一些可喜的進(jìn)步,但是往往因活體檢測(cè)成本太高而無法在近期達(dá)到實(shí)用化程度。
生物特征分為兩類,一類是生理特征,諸如指紋、人臉、虹膜等;一類是行為特征,諸如聲紋、簽名、姿勢(shì)等。在防假冒攻擊方面,屬于行為特征的聲紋具有天然的優(yōu)勢(shì)。
聲音信號(hào)具有“形簡(jiǎn)意豐”的特點(diǎn)。它簡(jiǎn)單得僅是一維信號(hào),但豐富得包含口音、語(yǔ)種、語(yǔ)義、情感、性別、說話人等各種信息。

綜合利用對(duì)這些信息的識(shí)別技術(shù),可以有效地提供防錄音、防錄音拼接、防脅迫等的解決方案。
語(yǔ)音假冒被認(rèn)為是聲紋識(shí)別的一大挑戰(zhàn)。語(yǔ)音假冒的種類包括人類模仿語(yǔ)音、機(jī)器合成語(yǔ)音、機(jī)器模擬語(yǔ)音、錄音重放等,其中公認(rèn)最難檢測(cè)的是錄音重放,因?yàn)橹胤耪Z(yǔ)音本來就是那個(gè)人的語(yǔ)音。
近期,清華大學(xué)-得意音通聲紋處理聯(lián)合實(shí)驗(yàn)室經(jīng)過攻關(guān),綜合利用信號(hào)處理、聽覺模型、模式識(shí)別等一系列人工智能技術(shù),成功研制出最先進(jìn)的錄音檢測(cè)技術(shù)。在一個(gè)含有65人,涉及當(dāng)今大部分主流手機(jī)型號(hào),共計(jì)3萬多次的錄音攻擊及檢測(cè)實(shí)驗(yàn)中,錄音檢測(cè)的等錯(cuò)誤率低至3.95%。該錄音檢測(cè)技術(shù)是基于動(dòng)態(tài)碼的“得意聲密保”方案的一次升級(jí),更加安全和可靠,真正做到“別人即使竊取了密碼也無法闖入”。
清華大學(xué)-得意音通聲紋處理聯(lián)合實(shí)驗(yàn)室未來的計(jì)劃是充分利用語(yǔ)音“形簡(jiǎn)意豐”的先天優(yōu)勢(shì),充分利用清華大學(xué)語(yǔ)音和語(yǔ)言技術(shù)中心30多年積累的先進(jìn)的語(yǔ)音和語(yǔ)言處理技術(shù)及人工智能技術(shù),實(shí)現(xiàn)“統(tǒng)一語(yǔ)音平臺(tái)”,以一句話解決所有問題,包括:理解用戶指令(利用語(yǔ)音識(shí)別技術(shù)知道用戶要做什么)、識(shí)別用戶身份(利用聲紋識(shí)別技術(shù)確認(rèn)用戶身份)、確認(rèn)用戶是否受到脅迫(利用情感檢測(cè)技術(shù)判斷用戶是否受到脅迫)、判斷用戶是否被錄音假冒(利用錄音檢測(cè)技術(shù)阻止錄音假冒闖入)等,以在提高系統(tǒng)安全度的同時(shí)提升用戶體驗(yàn)。