<thead id="7vlv5"><ruby id="7vlv5"></ruby></thead>
<cite id="7vlv5"></cite><thead id="7vlv5"><dl id="7vlv5"><th id="7vlv5"></th></dl></thead>
<thead id="7vlv5"><ruby id="7vlv5"></ruby></thead>
<ins id="7vlv5"></ins>
<cite id="7vlv5"><dl id="7vlv5"></dl></cite>
<var id="7vlv5"></var>
<menuitem id="7vlv5"></menuitem>
<listing id="7vlv5"></listing><thead id="7vlv5"><dl id="7vlv5"></dl></thead>
<listing id="7vlv5"><del id="7vlv5"></del></listing>

清華大學|信息學院|國家實驗室|English Version

“創交會”未來科技論壇:“人-機聯網”請先驗證“聲音密碼”


U5959P841DT20170512091740.jpg

"創交會“未來科技論壇現場

U5959P841DT20170512091832.jpg

清華大學語音和語言技術中心主任鄭方教授講解“聲紋識別”技術


讓人和機器用自然語言交流,是人工智能科學家多年來的夢想??墒?,如果機器連它對面說話的是誰都“傻傻分不清楚”,這一科幻場景就永遠只能停留在想象。

5月11日,成都“雙創會創交會”進入第二天。繼上午3位諾貝爾獎得主登臺演講后,備受矚目的“世界未來科技論壇”迎來了當前大熱的“人工智能”主題環節,其唯一講者是來自清華大學的鄭方教授。他帶來的正是目前解決“人機通訊”身份驗證問題的最新科技——用聲音作“密碼”。

AI狂飆突進之下被忽視的“安全”

只要留意下身邊就會發現,僅連接桌面計算機的PC互聯網時代已成過去,從以手機為接入終端的移動互聯網,到號稱“連接一切”的物聯網,被接入網絡(云)的各種終端智能設備數量正呈指數級增長。

然而問題來了:當物聯網+人工智能時代到來,網絡“大腦”究竟該如何分辨:哪些接入設備是你的,哪些接入設備是別人的?

可以設想,這一問題不解決將埋下種種隱患:一個人可以輕而易舉地盜數據、盜手機、盜銀行卡、盜汽車,甚至盜取你的“一切”。人們對網絡安全可靠性的擔心將永遠無法消除。

更進一步,如果網絡不能準確辨認人和機器的關系,不僅會給冒用盜用者以可乘之機,甚至還可能使機器逐漸脫離人的控制。這將使萬物互聯的價值和存在理由遭到嚴重挑戰。

“要解決網絡信息安全的‘最后一厘米’問題,人的遠程身份認證是關鍵?!编嵎浇淌诒硎?。然而在他看來,目前包括對安全性要求極高的手機銀行等在內的很多應用,其安全手段都沒有完全解決人(用戶)、機(智能終端)之間的一致性這“最后一厘米”問題。

生物特征識別,“想要認你不容易”

在喜聞樂見的諜戰片接頭場景里,要向對方證明“自己是自己”是一件相當困難的事。無論是證件還是暗號,即便不被自己弄丟或者遺忘,被對手仿冒、竊取的可能性更是多得令人防不勝防,陷入人人自危。

而在網絡和平年代,從財產到隱私,由身份確認導致的安全問題并不比戰爭年代更少。

鄭方教授認為,要證明“我是我”通常有三種手段:一種是根據“我知道什么”,比如接頭暗號、取款密碼等;一種是根據“我有什么”,比如身份證件、IC卡、銀行U盾等;還有一種是“我是誰”,即不憑借任何外界材料,“自己證明自己”。

這便是當前方興未艾的生物特征識別技術。它用起來最簡單,實現起來卻最復雜。

說到生物特征,人們最容易想到的是指紋和人臉。然而鄭方教授告訴記者,生物特征在科學家看來實際上包含兩大類,一類是生理特征,包括指紋、人臉、掌紋、虹膜、視網膜等統統屬于這一類;還有一類近來才逐漸被人所知,即行為特征,比如聲紋、簽名、步態、手勢、鍵盤敲擊等。兩類特征都具有個體唯一和不被遺忘等特點??墒?,不同生物特征的防攻擊能力卻存在很大差異。

就在兩個月前,中央電視臺“3?15”晚會上曝光的人臉識別技術安全漏洞就讓人們驚出了一身冷汗。主持人陳偉鴻在現場技術人員支持下,僅憑從微博上獲取的一張觀眾自拍照,就成功攻破了“刷臉登錄”的人臉認證系統,這場神奇的“換臉”黑科技也成為2017年“3?15”晚會上的一大亮點。

2016年6月,美國斯坦福大學的研究團隊研發出一款人臉跟蹤軟件Face2Face,它可以通過攝像頭捕捉用戶的動作和面部表情,然后使用該軟件驅動視頻中的目標人物做出一模一樣的動作和表情,效果極其逼真。

指紋和虹膜同樣難逃被攻擊的命運。在西班牙巴塞羅那舉辦2016年世界移動通信大會上,《華爾街日報》的記者做了一個實驗,  他先是把手指在一個軟膠模上按壓了5分鐘,待模具成型后,再使用一種粘土橡皮泥,便形成了一個指紋模。之后他將指紋膜按壓在iPhone的指紋傳感器上,手機瞬間被解鎖。而早在2015年,著名的混沌計算機俱樂部的安全研究員Jan  Starbug接受采訪時稱,僅僅需要用通過谷歌搜索找到的高清晰度圖像,就可以使用一些虹膜掃描工具進行攻擊……。

“人們最先認識的生物特征是生理特征,它是人體生物學上的特征,具有穩定可靠、易于辨別的特點。在早期,這些具有‘靜態’特點的生理特征被認為是具有天然優勢的;然而,隨著人工智能技術的飛速發展,其外在表現缺少變化反倒越來越成為一種劣勢,原因是這些特征容易模仿,一旦不慎‘遺失’或被非法竊取,就會一‘丟’百丟?!编嵎秸f。

芝麻開門吧!智能語音時代來了

相信很多人都有過這種經驗:畢業若干年后,你接到一個久未謀面的老同學電話,當電話那頭的聲音響起,你可能一下子就聽出了那個熟悉的聲音,你能馬上想起來他是誰,腦海里卻怎么也回憶不出他的模樣,可謂“欲辨已忘顏”。

而在古代寓言“阿凡提和四十大盜”和現代電影《大話西游》里,一句“芝麻,開門吧”,就成了阿凡提開啟寶藏和紫霞仙子打開盤絲洞大門的獨門咒語??墒?,如果換了個人念出這句咒語,結果又會怎樣?  寶藏之門還會只為阿凡提而開嗎?

在浙江衛視的流行科學節目《最強大腦》里,百度研發的智能機器人“度秘”雖然準確聽出了人的講話內容,卻在挑戰講話人是誰這一任務時遇到了難題。對此百度AI團隊的科學家是這樣解釋的,“聲紋識別要比語音識別困難得多”。

“聲紋識別不同于我們平常所說的語音識別,”鄭方解釋說,后者一般指的是識別講的內容,而不區分是誰講。他介紹,目前國內外語音識別技術都還做不到“理解”,只能類似機械化的把聲音抓成文字等等。而要讓機器理解人講的內容是什么、是什么意圖,還是件很遙遠的事。

不過,今天的機器已經能分辨出話是誰講的了,科學家把這種AI能力直觀稱為“說話人識別”。相關技術已經走出實驗室,開始進入百姓生活,這就是“聲紋識別”。

據了解,清華大學是我國最早開展生物特征識別研究的研究單位之一,鄭方便是語音團隊的關鍵人物。他師從我國著名的人工智能專家石純一教授和全國信息奧林匹克競賽總教練、清華大學吳文虎教授,并得到我國人工智能界“泰斗”、中國科學院院士張鈸的指導,從第一篇有關語音識別的論文開始,至今已二十多個年頭。2002年,為將這一科研成果產業化,清華大學支持成立了“得意音通”公司,擔負起智能語音技術產業化的重任。然而,由于技術極為復雜,在這期間,團隊一直在默默開展算法研究、產品優化和人才培養等,外界鮮見其發聲,行事極為低調。

2016年被媒體和投資界稱為中國AI元年。隨著谷歌“阿爾法狗”戰勝人類圍棋大師的新聞被爆炒,以機器學習為代表的AI技術仿佛一戰成名,進入大眾視野。而歷經數年艱苦研究,各種應用場景也紛紛落地。厚積薄發的聲紋識別等智能語音技術終于迎來大發展。

“最簡單地說,聲紋識別技術就是幫助你用你自己的聲音打造一把專屬于你的聲紋鎖?!编嵎酵嘎?,得意音通的旗艦產品之一“聲密?!币言趪倚畔⒅行耐度胧褂?,并預裝上中國建設銀行手機銀行客戶端,內測的最新版本已經具備了防錄音、防時變等能力。他們還與中國銀聯達成了戰略合作協議,近期“聲密?!币矊⒃谥袊y聯上線。作為金融、公安、工信等諸多行業聲紋標準的主要起草單位,這家清華系公司正廣泛涉獵包括移動電子支付在內的幾乎所有遠程身份認證應用領域,立志從最前端的身份驗證開始,推動中國人工智能行業的發展。

來自市場的跡象同樣表明,對智能語音的需求已在暗涌。工信部電子科學技術情報研究所最近的一份研究報告顯示,2017年全球智能語音產業規模將突破100億美元。

不只是身份識別,圍繞聲音還有更多的研究正在緊鑼密鼓的開展著。

鄭方介紹,由于聲音信號具有“形簡意豐”的優勢,從一小段聲音里就能提取出很多很多信息,比如身份、內容、性別、語種、口音、情感……?!氨热缒阏f話時的情緒是高興還是悲傷?是焦慮或是恐懼?是主動自愿地在說還是背后被人脅迫了才說?”這些信息都可以從聲音中得到。此外,通過聲音還可以“用一句話解決所有問題”。設想一下,用戶只要說出“給張三轉1000元錢”,系統就能同時完成業務識別、意圖識別及身份認證,這無疑可以為用戶帶來極大的便利。

“21世紀必定是語音的世紀?!辈稍L結束時,鄭方肯定地說。

轉自“新浪四川頻道”http://sc.sina.com.cn/city/xwgz/2017-05-12/092127622.html

 

【發布時間:2017-05-15】【瀏覽次數:3535】
如何玩秒速赛车赢