上世紀(jì)80年代末,還在加拿大攻讀碩的尤舒亞·本吉奧(Yoshua Bengio)被一個(gè)當(dāng)時(shí)并不怎么流行的想法迷住了。那時(shí),有少數(shù)從事人工智能研究的計(jì)算機(jī)科學(xué)家試圖研發(fā)這樣一種軟件,這種軟件可以大致模仿神經(jīng)元網(wǎng)絡(luò)在大腦中處理數(shù)據(jù)的方式,雖然當(dāng)時(shí)并沒有證據(jù)表明這是一種行得通的想法。
神經(jīng)元模擬20多年后,科技行業(yè)也后知后覺地愛上了這個(gè)想法。近年來,人工智能領(lǐng)域的長足進(jìn)步使得自動(dòng)駕駛汽車等項(xiàng)目能達(dá)到幾乎與人類相差無幾的智能程度,而神經(jīng)網(wǎng)絡(luò)就是人工智能蓬勃發(fā)展的幕后推手。
現(xiàn)在,55歲的本吉奧已成為了蒙特利爾大學(xué)的一名教授,就在今天,他與71歲的杰弗里·欣頓(Geoffrey Hinton)和58歲的楊立昆(Yann LeCun),共同獲得了計(jì)算機(jī)科學(xué)的最高獎(jiǎng)項(xiàng)——ACM圖靈獎(jiǎng)(該獎(jiǎng)項(xiàng)自1966年起每年頒發(fā)一次,以計(jì)算機(jī)之父艾倫·圖靈的名字命名)。
從左至右:楊立昆、杰弗里·欣頓、尤舒亞·本吉奧。圖片:Facebook/Google/Bolter AI他們?nèi)说奶剿髦梅路鹗且粍t關(guān)于勇氣的寓言。在遠(yuǎn)離追捧與聚光燈的地方,他們潛心研究了幾十年,把一個(gè)不被看好的、被邊緣化的想法,變成了計(jì)算機(jī)科學(xué)中最熱門的想法?,F(xiàn)如今,他們所倡導(dǎo)的技術(shù)已經(jīng)成為了每家大型科技公司的未來戰(zhàn)略的核心。谷歌測試中的軟件得以讀取醫(yī)學(xué)掃描,特斯拉的自動(dòng)駕駛儀得以讀取道路標(biāo)志,臉書得以自動(dòng)刪除一些惡毒言論,都是得益于他們?nèi)怂鶆?chuàng)造的技術(shù)。
此次將圖靈獎(jiǎng)授予這三位深度學(xué)習(xí)的教父,不僅是對(duì)他們工作的肯定,更表明了機(jī)器學(xué)習(xí)已經(jīng)成為了計(jì)算機(jī)科學(xué)中的一個(gè)核心領(lǐng)域。這個(gè)學(xué)科有一個(gè)悠久的傳統(tǒng),那就是重視問題的解決方案的數(shù)學(xué)證明。但機(jī)器學(xué)習(xí)算法會(huì)以一種更為混亂的方式完成任務(wù),它會(huì)跟蹤數(shù)據(jù)的統(tǒng)計(jì)軌跡,來找到在實(shí)際中行之有效的方法,即使我們并不清楚具體是如何做到的。
神經(jīng)網(wǎng)絡(luò)是人工智能最古老的方法之一,當(dāng)這個(gè)領(lǐng)域在20世紀(jì)50年代末剛起步時(shí)就已經(jīng)建立起來了。研究人員將神經(jīng)科學(xué)家創(chuàng)造的神經(jīng)元的簡單模型改造成數(shù)學(xué)網(wǎng)絡(luò),這種數(shù)學(xué)網(wǎng)絡(luò)可以通過讓一系列人工的“神經(jīng)元”對(duì)數(shù)據(jù)進(jìn)行過濾,來學(xué)習(xí)如何對(duì)數(shù)據(jù)進(jìn)行分類。早期成功的例子包括占據(jù)整個(gè)房間的感知機(jī)馬克1號(hào),它能學(xué)習(xí)如何分辨屏幕上的形狀。但當(dāng)時(shí)還不清楚要如何訓(xùn)練具有多層神經(jīng)元的大型網(wǎng)絡(luò),讓這項(xiàng)技術(shù)超越模擬的小型任務(wù)。
欣頓提出的解決方案是訓(xùn)練深度網(wǎng)絡(luò)。1986年,他與他人共同發(fā)表了一篇題為“Learning Internal Representations by Error Propagation”的開創(chuàng)性論文,提出了全新的反向傳播算法。欣頓證明了反向傳播算法可以讓神經(jīng)網(wǎng)絡(luò)去發(fā)現(xiàn)其自身對(duì)數(shù)據(jù)的內(nèi)部表達(dá),從而讓利用神經(jīng)網(wǎng)絡(luò)來解決之前無法解決的問題成為可能。如今,反向傳播算法處于深度學(xué)習(xí)的核心,但當(dāng)時(shí)這項(xiàng)技術(shù)還不夠成熟。
楊立昆說:“從90年代中期到21世紀(jì)的最初幾年,除了少數(shù)像我們這樣瘋狂的人,基本上沒有人研究神經(jīng)網(wǎng)絡(luò)。”楊立昆的貢獻(xiàn)包括發(fā)展了卷積神經(jīng)網(wǎng)絡(luò),上世紀(jì)80年代末,他是第一個(gè)用手寫數(shù)字圖像訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)的人。如今,卷積神經(jīng)網(wǎng)絡(luò)已成為計(jì)算機(jī)視覺、語音識(shí)別、語音合成、圖像合成和自然語言處理等領(lǐng)域的一個(gè)行業(yè)標(biāo)準(zhǔn)。它們?cè)谥T多領(lǐng)域均具有廣泛應(yīng)用,例如自動(dòng)駕駛、醫(yī)學(xué)圖像分析、聲控助手和信息過濾等等。
本吉奧開創(chuàng)了將深度學(xué)習(xí)應(yīng)用于序列(比如語音和理解文本)的方法。但直到本世紀(jì)初,在研究人員發(fā)現(xiàn)如何利用圖形處理器的能力之后,深度學(xué)習(xí)才觸及到更廣泛的世界。
一個(gè)關(guān)鍵的時(shí)刻出現(xiàn)在了2012年,當(dāng)時(shí),欣頓與他的兩名學(xué)生一起利用兩種算法對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了改進(jìn)。在著名的 ImageNet 比賽中,欣頓和他的學(xué)生出人意料地獲得了冠軍。他們以5次的猜測機(jī)會(huì),將10萬多張照片正確地分成1000個(gè)類別,準(zhǔn)確率高達(dá)85%,比第二名高出十多個(gè)百分點(diǎn)。這一勝利使得原本在該領(lǐng)域備受青睞的方法被拋諸腦后。
2013年初,谷歌收購了由他們?nèi)藙?chuàng)立的一家初創(chuàng)公司,自那之后,欣頓便一直留在了那里工作。同年,臉書也聘請(qǐng)了楊立昆。欣頓說,他和他的合作者能夠長期堅(jiān)持這些不受青睞的想法,是因?yàn)樵趦?nèi)心深處,他們都是特立獨(dú)行的人?,F(xiàn)在,無論在學(xué)術(shù)圈還是技術(shù)行業(yè),三位獲獎(jiǎng)?wù)叨际侵髁鞯囊徊糠帧?/p>
盡管深度學(xué)習(xí)已經(jīng)在實(shí)踐中取得了諸多成功,但它仍然有許多無法做到的事。神經(jīng)網(wǎng)絡(luò)的概念受到的是人類大腦的啟發(fā),但它與大腦并沒有太多的相似之處。深度學(xué)習(xí)賦予計(jì)算機(jī)的智能讓它可以在一些簡單的任務(wù)上表現(xiàn)出眾,例如玩某個(gè)特定的游戲,識(shí)別某些特定的聲音等,但它不像人類智能那樣具有適應(yīng)性和通用性。
欣頓和楊立昆說,他們希望能結(jié)束現(xiàn)有系統(tǒng)中對(duì)人來進(jìn)行的明確而又廣泛的訓(xùn)練的依賴。深度學(xué)習(xí)項(xiàng)目依賴于大量標(biāo)注的數(shù)據(jù)來解釋眼前的任務(wù),這是醫(yī)學(xué)等領(lǐng)域所面臨的一個(gè)主要限制。本吉奧強(qiáng)調(diào),盡管在一些領(lǐng)域我們?nèi)〉昧顺晒?,比如擁有了更好的翻譯工具,但這一技術(shù)還遠(yuǎn)遠(yuǎn)不能正確地理解語言。
三位獲獎(jiǎng)?wù)叻Q,他們不知道要如何解決余下的這些挑戰(zhàn)。他們建議,任何希望在人工智能領(lǐng)域取得下一個(gè)突進(jìn)突破的人,都應(yīng)效仿他們過去的做法——無視主流想法的意愿。本吉奧說:“他們不應(yīng)該隨波逐流,現(xiàn)在深度學(xué)習(xí)就是這股洪流。”
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。