AI新趨勢:打造無監督式通用神經網絡人工智能
尤爾根·施米德休伯教授是瑞士人工智能實驗室IDSIA的科學事務主管,同時任教于盧加諾大學和瑞士南部應用科學與藝術學院。他于1987年和1991年在慕尼黑工業大學先后獲得計算機科學的學士和博士學位。
自1987年以來,他一直著自我改進式通用問題求解程序的研究。從1991年開始,他成為深度學習神經網絡領域的開拓者。他在IDSIA和慕尼黑工業大學的研究團隊開發了一種遞歸神經網絡,并在正式的性比賽中獲勝。這些技術革新了連續手寫識別、語音識別、機器翻譯和圖片注釋,現在被谷歌、微軟、IBM、百度和其他很多公司應用。DeepMind深受他以前博士學生的影響。
從2009年起,施米德休伯教授成為了歐洲科學與藝術學院的院士。他獲得過很多獎項,包括2013年神經網絡協會的亥姆霍茲獎,以及2016年電氣與電子工程師協會的神經網絡先鋒獎。2014年,他參與創辦了人工智能公司NNAISENSE,旨在打造個有實用價值的通用人工智能。
深度學習是裝載新瓶子里的舊酒
什么是深度學習?它有著怎樣的歷史?
施米德休伯:它是裝在新瓶子里的舊酒。它主要是關于擁有多個后續處理層的深度神經網絡。利用如今速度更快的計算機,這樣的網絡已經徹底改變了模式識別和機器學習。“深度學習”這一術語由德克特在1986年首度引入機器學習領域,然后由艾森伯格等人在2000年引入人工神經網絡領域。
深度學習之父是烏克蘭的數學家伊凡卡內科。1965年,他和拉帕共同編寫了個用于監督式前饋多層感知的通用可行學習算法。1971年,他已經描述了一個八層的網絡(即使按照當前的標準,仍然稱得上有深度),并使用一種在新千年仍然流行的方法對它進行訓練。他遠遠于自己的時代——當時,計算機的運算速度比現在慢10億倍。
你對《科學》雜志上那篇關于人類層次概念學習的論文有何看法,它通過貝葉斯程序學習框架實現了“一次性學習”。施米德休伯:那篇論文很有趣。不過,我們也能通過標準的遷移學習來實現快速的一次性學習。方法就是,首先,基于眾多不同的視覺訓練集“慢慢地”訓練一個深度神經網絡,使得網絡的前10層變成一個相當通用的視覺預處理器;
然后,凍結這10層,以高學習速率在新圖像上僅對第11層進行重新訓練。多年來,這種方法一直運轉良好。
貝葉斯方法和深度學習方法有何異同?哪一種方法更可行?為什么?
施米德休伯:機器學習的優化版貝葉斯法在馬庫斯·胡特2002年提出的AIXI模型中得到了體現。他曾是我的博士后學生,現在是一名教授。任何計算問題都可以被表述為一個回報函數的大化問題。
AIXI模型基于所羅門諾夫的通用歸納模型M,其中包含了所有可計算的概率分布。如果世界對一些強化學習智能體行為的反應概率是可計算的(沒有證據可以反駁這一點),那么該智能體就可能用M(而不是其他準確卻未知的分布)來預測自己未來的感官輸入和回報,它就可以通過選擇使M預測回報大化的行為序列來實現行動的優化。
這或許可以被稱為人工智能的統計學方法——它展示了可能性的數學極限。然而,AIXI的優化概念忽略了時間的計算,這就是我們為什么仍然在使用通用性較差但更可行的方法,比如基于局限性更強的本地搜索技術(如梯度下降法)的深度學習。
《科學》雜志上的那篇論文稱,其結果“通過了視覺圖靈測試”。圖靈測試這種在半個多世紀以前提出的測試方法,至今仍然有效嗎?
施米德休伯:跟我聊天的對象在我看來像是人類嗎?如果像,那么它就通過了我個人的圖靈測試。這種測試的主要問題在于,它的主觀性太強,正如維森鮑姆幾十年前所證明的那樣。有一些人總比其他人更容易上當。
與DeepMind不解之緣
你對《自然》雜志上谷歌DeepMind關于AlphaGo的論文有何看法,它是一款擊敗了職業圍棋選手的程序。AlphaGo算是這個領域的重大突破嗎?是什么幫助AlphaGo取得了這樣的成就?
施米德休伯:我對谷歌DeepMind的成功感到高興,這也是因為該公司深受我以前學生的影響:在DeepMind初的四名成員中,有兩人來自IDSIA,一位是聯合創始人,另一位是DeepMind的首名員工,他們也是該公司早的人工智能學博士;后來,我的另外幾位博士生也加入了DeepMind,其中一位曾在2010年與我聯合發表了一篇關于“吃子棋”的論文。
在圍棋這種棋盤游戲中,“馬爾科夫假設”是成立的:原則上,當前的輸入(即棋盤狀態)包含了確定下一步佳行動所需的全部信息,不需要考慮之前的狀態。
也就是說,該游戲可以通過傳統的強化學習來處理。這有點像20年前的情形,當時IBM的特索羅利用強化學習從頭學起,打造出一個可與人類世界匹敵的雙陸棋程序。
然而,到了如今,我們從一個事實中受益良多:每單位成本計算機的速度至少比以前快1萬倍。過去幾年中,自動化的圍棋程序已經得到極大的改進。為了學習成為一位的圍棋選手,DeepMind的系統結合使用了多種傳統方法,比如監督式學習(即向人類專家學習)以及基于蒙特卡洛樹搜索的強化學習。
然而很可惜,“馬爾科夫假設”的條件在現實世界的場景中并不成立。這就是為什么現實世界的游戲(比如足球)要比象棋或圍棋更難,也正因為此,生活在部分可觀測環境中的強化學習機器人的強人工智能,才需要更復雜的學習算法,比如針對遞歸神經網絡的強化學習。
近,谷歌DeepMind宣布進軍醫療市場,你對此有什么看法?施米德休伯:我們對深度學習在醫療領域的應用非常感興趣。事實上,2012年時,IDSIA的團隊就開發出了贏得醫療成像大賽的深度學習程序。
看到很多公司現在都將深度學習用于醫療成像和類似領域,我很高興。全世界每年在醫療保健上的花費占到GDP總量的10%以上(每年超過7萬億美元),其中大部分是用于醫療診斷。
實現這個過程的部分自動化不僅可以省下數十億美元的資金,還可以讓很多目前無力負擔費用的人享受到專家級的醫療診斷。在這種語境下,醫院寶貴的資產也許是它們的數據——這就是為什么IBM會在一家收集此類數據的公司身上花費10億美元。
你怎樣看待IBM的新沃森物聯網平臺?人工智能在物聯網領域有何潛力?對人工智能來說,“人工智能即服務”會成為一種有前景的趨勢嗎?
施米德休伯:物聯網的規模會比人聯網大得多,因為機器的數量遠遠多于人類。而且,很多機器的確會向其他機器提供“人工智能服務”。廣告讓人聯網具有了商業化能力,但物聯網的商業模式似乎沒有那么明顯。
機器還不能像人一樣學習,但是快了
有人說,未來屬于無監督式學習,你認同嗎?施米德休伯:我會說,過去也屬于無監督式學習,也就是在沒有老師監督的情況下,檢測所觀察現象中的規律性,這本質上就是適應性的數據壓縮,比如通過預測編碼。我在25年前發表了這方面的篇論文——實際上,這篇論文在1991年催生出個可以運行的“極深學習程序”,它可以處理數百個后續計算層。機器可以像人類那樣學習嗎?
施米德休伯:目前還不能,但可能快了。

智能制造網APP
智能制造網手機站
智能制造網小程序
智能制造網官微
智能制造網服務號











智能控制
機器人
儀器儀表
物聯網
3D打印
工業軟件

回放




浙公網安備 33010602000006號
智能制造網APP
智能制造網小程序
微信公眾號


