在人人都能對(duì)無人駕駛、語音識(shí)別、AI醫(yī)療等評(píng)頭論足的今天,又有多少普通人真正了解“人工智能”是如何從不被看好到今天的火爆的?還有,我們要了解什么學(xué)科才能更好地理解AI?人工智能到底是會(huì)把人類帶入烏托邦還是世界末日?人類會(huì)成為人工智能的奴隸嗎?
這些高屋建瓴,又尤其需要理性思考的問題,當(dāng)然需要人工智能領(lǐng)域先驅(qū)者提供視角與答案。
特倫斯·謝諾夫斯基 出版社供圖
特倫斯·謝諾夫斯基(Terrence Sejnowski)在人工智能領(lǐng)域的地位舉足輕重,作為神經(jīng)網(wǎng)絡(luò)和計(jì)算神經(jīng)科學(xué)的先驅(qū),他對(duì)這些議題擁有絕對(duì)的話語權(quán)。此次來到中國(guó),僅僅兩天的行程,就有十多家媒體蜂擁而至。國(guó)內(nèi)的神經(jīng)科學(xué)家、腦科學(xué)家、計(jì)算機(jī)科學(xué)家、心理學(xué)家、當(dāng)然還有所有對(duì)AI感興趣的各行各業(yè)人士都希望能和他聊上一聊。
他奪目的光環(huán)包括:世界十大人工智能科學(xué)家之一,美國(guó)僅 3 位在世的四院院士之一,他還同時(shí)兼任NIPS(全球人工智能頂級(jí)會(huì)議)主席,奧巴馬政府“大腦”計(jì)劃顧問委員會(huì)委員等等。
早在1986 年,他就與上周獲得“圖靈獎(jiǎng)”的杰弗里·辛頓(Geoffrey Hinton)共同發(fā)明了玻爾茲曼機(jī),開啟了神經(jīng)網(wǎng)絡(luò)的快速發(fā)展。正是基于此項(xiàng)貢獻(xiàn),深度學(xué)習(xí)從邊緣課題變成了人工智能仰賴的核心技術(shù)。也就是說,他和好友杰弗里·辛頓直接推動(dòng)了人工智能的井噴式發(fā)展。
特倫斯除了是一名杰出的科學(xué)家和研究者,還是一名十分擅長(zhǎng)傳授知識(shí)和理念的教授,他本人一直于在線學(xué)習(xí)平臺(tái) Coursera開設(shè)一門名為《學(xué)會(huì)如何學(xué)習(xí)》的免費(fèi)課程,通過系統(tǒng)講解大腦認(rèn)知的底層知識(shí),讓學(xué)習(xí)者可以改變思維模式,提高學(xué)習(xí)的能力和效率。截至目前,已吸引了超過 300 萬聽眾,被認(rèn)為是全球最受歡迎的互聯(lián)網(wǎng)課程之一。
作為最了解人工智能歷史、趨勢(shì),最早開啟人工智能浪潮的人,一個(gè)長(zhǎng)期致力于科普的教授與作家,七十四歲的特倫斯前不久前剛出版了這本《深度學(xué)習(xí)》。用他自己的話說,“現(xiàn)在市面上有百余本關(guān)于人工智能的書。但他們都太情緒化了,要么鼓吹人工智能的優(yōu)勢(shì)將會(huì)幫助全人類,以后我們將生活在烏托邦,要么走向另一個(gè)極端——人工智能將帶來世界末日。但我們要知道,現(xiàn)實(shí)是介于兩者之間的。我想做的就是提供一個(gè)對(duì)未來可能性更實(shí)際的評(píng)估。此外,AI領(lǐng)域發(fā)展得如此之快,以至于人們甚至都不知道它的發(fā)展方向。所以,未來到底在哪里呢?”
這也是一本關(guān)于深度學(xué)習(xí)的科普讀物,為圈外人了解深度學(xué)習(xí)在過去60年間的發(fā)展脈絡(luò)與人工智能的螺旋上升,了解AI的過去、現(xiàn)在和未來提供了絕佳的材料。
3月31日上午,澎湃新聞就本書的內(nèi)容,對(duì)深度學(xué)習(xí)以及算法的相關(guān)問題,對(duì)人工智能的倫理問題等對(duì)特倫斯·謝諾夫斯基專門進(jìn)行了一次采訪。特倫斯罕見地強(qiáng)調(diào)了他在科研領(lǐng)域從無名之輩到“中頭彩”的傳奇經(jīng)歷,他希望中國(guó)讀者喜歡他講述的這個(gè)不迷信權(quán)威的故事,他說:“我不信任權(quán)威。即使他們擁有所有的權(quán)力,也不意味著他們是對(duì)的。人要相信自己,你的直覺很重要。即使現(xiàn)在你沒有權(quán)力,或許有一天你會(huì)的。”
“為什么人工智能的突破不是通過寫程序,而是通過深度學(xué)習(xí)?”
澎湃新聞:你撰寫這本書的初衷是什么?你希望中國(guó)讀者可以從這本書里學(xué)到什么?
特倫斯:這本書其實(shí)是記敘性的,我講了一個(gè)故事,提供了很多背景資料。很多讀報(bào)紙的人會(huì)誤以為所有的關(guān)于AI和深度學(xué)習(xí)的發(fā)展都是一夜之間發(fā)生的。這是因?yàn)樵谶^去的三十年里,學(xué)術(shù)研究一直只在幕后進(jìn)行,沒人聽說過,然后它卻突然間上了報(bào)紙。所以我認(rèn)為,需要有人出來向公眾解釋它是從哪里來的,以及科學(xué)是如何運(yùn)作的。我認(rèn)為一定要有人來講這個(gè)故事。
現(xiàn)在市面上有很多關(guān)于人工智能的書。我想大概有一百本這樣針對(duì)大眾的書,但這些書都只是為了制造噱頭,要么是鼓吹著人工智能的優(yōu)勢(shì)將會(huì)幫助全人類,以后我們將生活在烏托邦。要么走向另一個(gè)極端——人工智能將帶來世界末日。人類將被統(tǒng)治,成為人工智能的奴隸。但你要知道,現(xiàn)實(shí)是介于兩者之間的。我想做的就是提供一個(gè)對(duì)未來可能性更實(shí)際的評(píng)估。還有另外一件事需要注意,就是這個(gè)領(lǐng)域發(fā)展得如此之快,以至于人們甚至都不知道它的發(fā)展方向。所以,未來到底在哪里呢?
我的書可以分為三個(gè)部分。第一部分是談?wù)撨^去,即我們從哪里來?第二部分是具體的算法,試著解釋算法的原理。我盡我最大的努力去解釋算法到底是什么(笑),以及我們?cè)诎l(fā)展的過程中遇到了什么困難,又是如何克服的。
最后一部分是展望未來,我試圖解釋神經(jīng)科學(xué)和人工智能之間的關(guān)系。
這本書要傳達(dá)的信息就是,人工智能和大腦之間有一種趨同,它們實(shí)際上正在走向一起。人工智能越來越像人的大腦,并且受到腦科學(xué)的啟發(fā)。當(dāng)人工智能得到發(fā)展后,腦科學(xué)也可以受益。因?yàn)槲覀冊(cè)跈C(jī)器學(xué)習(xí)中開發(fā)的這些工具和技術(shù)將可以用來解釋大腦。所以,這兩個(gè)領(lǐng)域之間有著很好的互動(dòng)。
但我希望中國(guó)讀者能夠從書中學(xué)到的是失敗者的故事。我們是在1980年代開始這些研究的。那個(gè)時(shí)候?qū)W界被斯坦福,麻省理工和卡內(nèi)基梅隆這樣的大學(xué)所統(tǒng)治。他們從政府那里得到所有的經(jīng)費(fèi)和工作。他們有權(quán)威,也是專家。這些人得到了最好的工作,控制著他們的學(xué)生。他們還得到了所有的關(guān)注。簡(jiǎn)言之,他們是掌權(quán)的人,是權(quán)威人士。而這時(shí)候我們是誰呢?我們很年輕,是無名之輩。當(dāng)時(shí)我和杰弗瑞(Geoffrey Hinton)在一個(gè)會(huì)議上遇見了,我們都覺得這些權(quán)威人士的方法是錯(cuò)誤的。之所以錯(cuò)是因?yàn)椴磺袑?shí)際,或者說,他們的方法實(shí)際上沒有取得任何進(jìn)展。
他們的確解決了一些問題,比如做些小玩具演示。但是他們沒有解決任何高難度問題,比如視覺。視覺對(duì)人類來說很簡(jiǎn)單。你睜開眼睛,一抬頭,就看到了東西,一個(gè)物體、一只手,又或者是文字。這件事就是發(fā)生了,人類把這視作理所當(dāng)然,因?yàn)檫@一切都是在無意識(shí)中發(fā)生的。正因此,你不知道為什么你可以看見東西。盡管沒人知道這是怎么一回事,但當(dāng)時(shí)研究人工智能的人卻覺得視覺是個(gè)簡(jiǎn)單的問題。因?yàn)橄啾戎拢麄兛梢詫懸粋€(gè)可以玩游戲,并且解決理論和數(shù)學(xué)問題的程序。他們認(rèn)為這是最難的,他們覺得數(shù)學(xué)比視覺復(fù)雜得多。但他們完全錯(cuò)了。
這本書講述了我當(dāng)時(shí)作為無名之輩的故事。在當(dāng)時(shí),我作為年輕的研究人員沒有地位,也是剛開始工作。所有的權(quán)威人士都沿著一條路走??晌覀冋J(rèn)為他們錯(cuò)了。但我們是誰呢?我們只是有自己的想法而已,我們不能改變這個(gè)世界的運(yùn)作方式。在那里我們根本沒有任何權(quán)力。而我們擁有的,就是干勁、年輕的熱情和對(duì)自己的信念。
我們相信我們有不同的方法來解決智能的問題。我們從解決大腦問題的方式中得到啟發(fā),因?yàn)檫@是唯一能證明你能解決問題的依據(jù)。我們意識(shí)到的舊方法的錯(cuò)誤之處就在于,計(jì)算機(jī)和大腦的結(jié)構(gòu)是不同的。大腦是大規(guī)模并行的結(jié)構(gòu)。計(jì)算機(jī)只有一個(gè)處理器和內(nèi)存,且它們互相聯(lián)系。但這就是瓶頸所在:你得不到足夠的信息。但大腦是在處理大量的信息,且必須同時(shí)進(jìn)行。
舉個(gè)例子,如果傳統(tǒng)的計(jì)算機(jī)要掃描一幅圖像,它一次只能掃描一個(gè)像素點(diǎn),但你的視網(wǎng)膜有一百萬個(gè)感光細(xì)胞同時(shí)工作,所以效率更高。一邊是很多種不同類型的計(jì)算機(jī),一邊是大腦。人工智能的研究人員一直盯著計(jì)算機(jī)想要解決智能的問題。但大腦就在這里等著你研究,為什么他們要看那邊呢?
有一句諺語是這么說的,如果你丟了鑰匙,不要因?yàn)槟睦镉泄饩腿ツ睦镎摇S泄獾牡胤讲⒉灰馕吨€匙在那里,對(duì)吧?你看到有人在燈柱下搜索。但是丟鑰匙的人是我,他們?cè)谀菍ふ也⒉灰馕吨隳苷业阶约旱蔫€匙。事實(shí)上,你把鑰匙丟在這條巷子里了。因此,如果你不往小巷里找,你就找不到你的鑰匙。這就是我想說的,人必須看到別的地方。
澎湃新聞:你覺得我們今天已經(jīng)完全了解視覺是如何運(yùn)作了的嗎?
特倫斯:我認(rèn)為我們還沒有。我們永遠(yuǎn)無法知道一切,這個(gè)目標(biāo)太高了。但實(shí)際上,我們運(yùn)用深度學(xué)習(xí)和神經(jīng)元的知識(shí),了解了很多猴子視覺皮層神經(jīng)元的知識(shí)。這兩個(gè)方面的知識(shí)正在匯聚。我想很快我們會(huì)有一個(gè)視覺理論,一個(gè)關(guān)于視覺背后的機(jī)理的數(shù)學(xué)解釋。
澎湃新聞:那些當(dāng)時(shí)壟斷人工智能領(lǐng)域的人,他們是計(jì)算機(jī)科學(xué)家嗎?
特倫斯:對(duì),他們大部分是工程師。計(jì)算機(jī)科學(xué)也在發(fā)展,這門學(xué)科是和計(jì)算機(jī)一起誕生的。計(jì)算機(jī)直到五六十年代才開始出現(xiàn)。所以人工智能誕生的時(shí)間和計(jì)算機(jī)差不多。計(jì)算機(jī)科學(xué)在誕生后的幾十年里并沒有真正形成一門學(xué)科。
回到那個(gè)為什么當(dāng)時(shí)的權(quán)威人士錯(cuò)了的問題,這涉及到我們的直覺到底從何而來?
我們的直覺來自于這樣一個(gè)事實(shí):唯一存在的能證明你能解決這些問題的證據(jù),比如視覺問題,就是大自然已經(jīng)解決了這個(gè)問題。因?yàn)槌酥饩蜎]有人了,沒有程序可以做到這一點(diǎn)。他們想寫一個(gè)關(guān)于視覺的程序,但是沒人知道怎么做。他們嘗試了許多方法,結(jié)果都是一場(chǎng)空,就像你說的,是一個(gè)非常難的問題。它是如此的困難,以至于人類用了數(shù)百萬年,甚至幾億年的時(shí)間來進(jìn)化,來完善我們的視力,直到達(dá)到今天如此智能的程度。
澎湃新聞:關(guān)于剛才談到的視覺的機(jī)理,是接下來十幾年就可以完成的嗎?
特倫斯:我想我們已經(jīng)差不多完成了,現(xiàn)在已經(jīng)很接近了。數(shù)學(xué)家們正在研究這個(gè)問題。幾周前我參加了美國(guó)國(guó)家科學(xué)院的一個(gè)會(huì)議,是關(guān)于深度學(xué)習(xí)的。然后一些數(shù)學(xué)家說,這是一個(gè)函數(shù)。這就是數(shù)學(xué)家擅長(zhǎng)的研究問題的方法,所以我想他們應(yīng)該能算出來。他們現(xiàn)在正用非常強(qiáng)大的數(shù)學(xué)工具和技術(shù)來解決這個(gè)高維空間的曲面幾何問題。如果你有數(shù)十億這樣連接強(qiáng)度的數(shù)據(jù),比如你的模型中有十億個(gè)這樣的參數(shù),那你就是在這些參數(shù)間,尋找一個(gè)適合現(xiàn)實(shí)世界函數(shù)的解。而大腦實(shí)際上有更多這樣的結(jié)構(gòu),它有大約一百萬億個(gè)突觸。這是個(gè)天文數(shù)字。
但是我們認(rèn)為,通過分析能夠?qū)ψR(shí)別物體和圖像的深度學(xué)習(xí)網(wǎng)絡(luò)的運(yùn)作原理,我們也可以將這些原理應(yīng)用到大腦,因?yàn)榇竽X結(jié)構(gòu)和這些網(wǎng)絡(luò)的相似性。和大腦相比,網(wǎng)絡(luò)很簡(jiǎn)單,但我認(rèn)為它們有相同的功能和原理,或者類似的數(shù)學(xué)描述,只是大腦要復(fù)雜得多。
另一個(gè)問題是,研究人工智能的人,他們最開始的目標(biāo)是研究人類的智力?;旧?,他們想要寫一個(gè)和人腦一樣智能的程序。這種“一般性智力”意味著你可以解決各種各樣的問題。但人很靈活,可以適應(yīng)新的環(huán)境。這對(duì)人類來說是很特別的,也是我們比任何其他物種都做得更好的地方。
澎湃新聞:而且我們大腦的能耗很低,對(duì)吧?我看到過一個(gè)數(shù)據(jù),如果計(jì)算機(jī)要達(dá)到人腦那樣同樣的功能,我們需要幾百臺(tái)超級(jí)計(jì)算機(jī),才能達(dá)到同樣的功能。
特倫斯:是的,生物用了數(shù)億年不只是提出問題的解決方案,而且優(yōu)化了電力成本。所以你大腦的用電量和21個(gè)燈泡的用電量差不多。而這個(gè)用電量對(duì)計(jì)算機(jī)而言是很小的??墒侨四X的計(jì)算能力卻超過最大的超級(jí)計(jì)算機(jī)。最大的超級(jí)計(jì)算機(jī)可以覆蓋我們這個(gè)大樓的地板,就像大型中國(guó)超級(jí)計(jì)算機(jī),對(duì)吧?它們消耗著成千上百萬瓦的電力。所以數(shù)字計(jì)算機(jī)需要消耗的電量比大自然的要多得多。這是驚人的,這就是我們的直覺。
另一方面,這個(gè)問題確實(shí)反映了我們的處境。我們認(rèn)為我們已經(jīng)解決了難題——計(jì)算機(jī)和現(xiàn)實(shí)世界的連接。換句話說,“能夠看見”是擁有一般智力的先決條件。在人工智能中,這被稱為“接地”(grounding)。
澎湃新聞:這又是什么意思呢?
特倫斯:研究人工智能的人和語言學(xué)家會(huì)說,單詞“杯子”(cup),它是一個(gè)單詞,但它代表了什么意思?它代表了所有可能存在的杯子,包括大杯子和小杯子,不管是紙做的還是玻璃做的,這些都是杯子。這很好,但問題是,如果你想寫一個(gè)指向“杯子”圖像的程序。因?yàn)楸涌梢杂泻芏嗖煌男问?,上百萬種不同的形狀和大小,所以一個(gè)可以識(shí)別所有可能的杯子的程序是寫不出來的。
這就是問題所在,“寫”程序是不可能的。這就意味著“杯子”的概念是沒有根據(jù)的。你不可能把這個(gè)符號(hào)和世界上所有我們稱之為杯子的東西聯(lián)系起來。這就是“接地”(grounding)。但現(xiàn)在我們可以這樣做了。我們有一個(gè)非常強(qiáng)大的深度學(xué)習(xí)網(wǎng)絡(luò),它可以針對(duì)成千上萬種不同的杯子進(jìn)行訓(xùn)練。
澎湃新聞:你提到過GANS(生成對(duì)抗性網(wǎng)絡(luò))是十分高效的,它會(huì)自己產(chǎn)生一輛新的車的影像。
特倫斯:這是另一個(gè)很好的例子,是另一種網(wǎng)絡(luò)。這不是我剛才說的那種“輸入—輸出”的模式,你給我一個(gè)圖片,它就能識(shí)別出是一輛車。GANS的神奇之處在于,你給了它100萬張杯子的圖片,它就能夠創(chuàng)建新的杯子的圖像。
我舉一個(gè)例子。我可以訓(xùn)練一只猴子識(shí)別出杯子的圖案,實(shí)際上你也可以訓(xùn)練一只鴿子做到這件事。換句話說,你通過多次訓(xùn)練鴿子,把這件事變成反射。信息輸入,反應(yīng)輸出,這是一個(gè)反射,對(duì)吧?它是由事件驅(qū)動(dòng)的。這叫做感官運(yùn)動(dòng),感官輸入,感官輸出。你可以訓(xùn)練人這樣做。然而,人們也可以只是坐在那里,就產(chǎn)生想法,他們不需要任何輸入。晚上,你躺在床上,天很黑,你開始想事情。你是怎么開始想到這些東西的呢?這是你的大腦內(nèi)部生成的。它是活躍的,是內(nèi)在的。比如說,你可能突然想起來你忘記關(guān)掉浴室的燈了,所以你起床去洗手間。而這個(gè)印象不是來自浴室,而是來自你的腦袋。
深度學(xué)習(xí)網(wǎng)絡(luò)比傳統(tǒng)編程究竟好在哪?
澎湃新聞:人工智能是一個(gè)跨學(xué)科的領(lǐng)域,你是神經(jīng)學(xué)家,這個(gè)領(lǐng)域里還有計(jì)算機(jī)科學(xué)家,也有認(rèn)知科學(xué)家,他們是怎么分別對(duì)這個(gè)領(lǐng)域做出貢獻(xiàn)的呢?
特倫斯:是的,這是一個(gè)非常好的問題。事實(shí)上,我原來的專業(yè)是物理,后來我轉(zhuǎn)到神經(jīng)科學(xué)。杰弗瑞(Geoffrey Hinton)起先學(xué)的是心理學(xué),然后才轉(zhuǎn)到人工智能的行業(yè)。我想這可能就是為什么我們能擁有和主流不同的觀點(diǎn)。那些研究人工智能的人,他們都是從和其他人一樣的角度看問題。掌權(quán)者編寫教科書,他們同時(shí)也教書。進(jìn)入這個(gè)領(lǐng)域?qū)W習(xí)的學(xué)生讀了他們寫的課本,就相信了他們的理論。但是我們是從別的學(xué)科進(jìn)入這個(gè)領(lǐng)域的。我沒有讀過那些課本,我也不必相信那些東西。所以令人驚嘆的就是,即使他們有這么大的控制力,現(xiàn)在完全被翻轉(zhuǎn)了。隨著時(shí)間的推移,我們的算法規(guī)模迅速發(fā)展。人工智能的關(guān)鍵就是想出一個(gè)更好的算法,讓你的計(jì)算能力越來越強(qiáng)。
而傳統(tǒng)的算法是組合性的。當(dāng)問題變復(fù)雜,可能性爆炸式增長(zhǎng),這種算法很難發(fā)展。它們只能解決“Toy problems”,而不能解決現(xiàn)實(shí)世界中的問題。所以一旦他們想把它應(yīng)用到現(xiàn)實(shí)世界,它就會(huì)爆炸,根本無法應(yīng)用。順便說一句,80年代時(shí)我們并不知道這個(gè)規(guī)模到底會(huì)有多大,因?yàn)槟菚r(shí)候網(wǎng)絡(luò)規(guī)模很小。計(jì)算機(jī)運(yùn)行速度很慢,所以這些程序不會(huì)太復(fù)雜,只有幾百個(gè)單位。但是現(xiàn)在計(jì)算機(jī)的速度比那時(shí)快了一百萬倍,網(wǎng)絡(luò)是原來的一百萬倍大,我們的算法擴(kuò)展得非常漂亮。層數(shù)越多,包含的單位數(shù)就越多。擁有的參數(shù)越多,運(yùn)行效果就越好。大概五年前,我們的算法達(dá)到了一個(gè)臨界點(diǎn)。我們突然能夠解決現(xiàn)實(shí)世界中有關(guān)視覺、語言和翻譯的問題?,F(xiàn)在,這個(gè)結(jié)構(gòu)被應(yīng)用到成千上萬個(gè)不同的問題上,比如商業(yè)領(lǐng)域的很多問題。只要你有足夠的數(shù)據(jù),你就可以用它們來訓(xùn)練網(wǎng)絡(luò)。隨著參數(shù)增多,需要的數(shù)據(jù)也變多。
澎湃新聞:談到算法,神經(jīng)網(wǎng)絡(luò)的算法和傳統(tǒng)程序的算法到底有什么不同呢?
特倫斯:區(qū)別就在于“學(xué)習(xí)”。雖然他們都被稱作“算法”,但卻是兩種解決問題的方法。傳統(tǒng)的人工智能研究人員編寫代碼,嘗試觸及每一種可能性。比如你想識(shí)別杯子,你必須為每一種可能出現(xiàn)的杯子編寫一行代碼。這是一個(gè)龐大的項(xiàng)目,需要寫作很長(zhǎng)時(shí)間。因?yàn)榫幊绦枰馁M(fèi)很多人力,所以這非常昂貴。與之相反的算法是“學(xué)習(xí)算法”,它會(huì)說,“不不不,我們不要寫代碼。只要給我很多例子就行。”所以每次它的數(shù)據(jù)庫增加一個(gè)樣本,它就會(huì)變好,變得越來越擅長(zhǎng)解決問題。它會(huì)比較新的輸入和之前輸入之間的相似性。這個(gè)過程被稱為“泛化”(Generalization)。
所以如果你曾給這個(gè)系統(tǒng)輸入了一千個(gè)樣本,這時(shí)你再輸入一個(gè),即使這個(gè)和你之前訓(xùn)練它的不同,這被稱為“判例案件”(Test case)。如果它也識(shí)別出了這個(gè)樣本,那就意味著在某種程度上,它理解了“杯子”的概念。就比如你有一千個(gè)杯子?,F(xiàn)在如果給你展示一個(gè)從未見過的新杯子,你就知道這是一個(gè)杯子——這就是人類所做的,我們非常善于學(xué)習(xí)。我們擅長(zhǎng)從一些例子中歸納,也能看到它們之間的關(guān)系。這是因?yàn)槲覀冇幸环N神奇的吸收新信息的能力,并將其融入到我們過去的經(jīng)歷中。
這兩種算法還有一個(gè)非常重要的區(qū)別,且這一點(diǎn)很重要:即使傳統(tǒng)算法成功地寫了一個(gè)視覺程序,這也不能幫助他們寫一個(gè)語音識(shí)別程序。換句話說,針對(duì)每一個(gè)問題寫出的程序都是單獨(dú)的。再換句話說,想解決新的問題?你必須從頭開始。一個(gè)視覺程序不能語音識(shí)別,一個(gè)語音識(shí)別程序不能做視覺。所以如果你有100個(gè)問題要解決,基本上你必須要寫100個(gè)不同的程序。這種勞動(dòng)密集型是難以置信的。但是,如果你有一個(gè)學(xué)習(xí)算法,你不需要寫一個(gè)新的程序。你只是在用同樣的程序接受不同的數(shù)據(jù),你只需要收集數(shù)據(jù)。所以這是非常高效的方式。
澎湃新聞:例如自動(dòng)駕駛汽車對(duì)深度學(xué)習(xí)的應(yīng)用?
特倫斯:是,這也是一個(gè)很好的例子。大約十年前有個(gè)比賽,誰的汽車能夠駛過加州北部猶他州邊境一百二十英里的路程,就可以獲得兩百萬美元的獎(jiǎng)金。那里有很多蜿蜒的道路,有很多你不得不穿過的非常困難的地形,還有巖石和大圓石。獲勝的那輛車是由斯坦福大學(xué)的Sebastian thrun建造的,當(dāng)時(shí)他和我來自同一個(gè)社區(qū)——神經(jīng)信息處理中心,所以他相信“學(xué)習(xí)”的力量。而卡內(nèi)基梅隆大學(xué)的人,他們?cè)O(shè)計(jì)了一個(gè)重型卡車。這輛裝滿計(jì)算機(jī)的大卡車非常笨重地前行。塞巴斯蒂安,我的書里有他的照片,他的小車一路暢行。他是怎么做到的呢?雖然他不知道機(jī)理是什么,他是這樣訓(xùn)練它的車的:他開著車在那個(gè)區(qū)域到處轉(zhuǎn),到各種各樣不同的道路上。汽車上有傳感器,所以能接收很多感官輸入信息,或者叫視覺雷達(dá),它能夠檢測(cè)到物體在哪里以及它們有多遠(yuǎn)。在他開車的時(shí)候,他進(jìn)行一系列的比如轉(zhuǎn)動(dòng)方向盤、踩剎車等操作。這些他收集的數(shù)據(jù)都被用來訓(xùn)練這個(gè)網(wǎng)絡(luò)。這雖然不是一個(gè)“深度學(xué)習(xí)網(wǎng)絡(luò)”,但是屬于“機(jī)器學(xué)習(xí)”,是一種“學(xué)習(xí)算法”。
那輛車后來自己開到了伊拉克。因?yàn)樗乐懊鎸?duì)各種巖石的路況時(shí),駕駛員是如何操作的。所以從以前的駕駛經(jīng)驗(yàn)中,它學(xué)會(huì)了如何在類似的情況下駕駛汽車。所以這里的學(xué)習(xí)指的是,如何理解環(huán)境的特點(diǎn),以及面對(duì)障礙時(shí)人類對(duì)環(huán)境做出的反應(yīng),最終保持在路上行駛。
澎湃新聞:真的很神奇。
特倫斯:對(duì)我而言,這是一個(gè)轉(zhuǎn)折點(diǎn),因?yàn)檫@表明我們的方法在現(xiàn)實(shí)世界中的應(yīng)用是可行的。他贏了200萬美元,而這個(gè)領(lǐng)域也中了頭彩,意味著這種算法會(huì)越來越好。事實(shí)也確實(shí)如此。十年就這樣過去了。2012年,在一次會(huì)議上,日本的科學(xué)家發(fā)表了一篇論文,證明
深度學(xué)習(xí)網(wǎng)絡(luò)做得比傳統(tǒng)編程要好得多。因?yàn)閷?duì)傳統(tǒng)編程而言,針對(duì)每一個(gè)新對(duì)象,他都要編寫一個(gè)新程序來識(shí)別它。
澎湃新聞:你認(rèn)為自己很幸運(yùn)嗎?因?yàn)槟阋恢眻?jiān)信這種“學(xué)習(xí)算法”?
特倫斯:我說我中了頭彩,但是,我同時(shí)也冒了險(xiǎn)。我在事業(yè)上冒了很大的風(fēng)險(xiǎn),我曾經(jīng)并不知道結(jié)果會(huì)怎樣。但是我有一個(gè)強(qiáng)烈的信念,那就是直覺。我的直覺是基于比計(jì)算機(jī)更廣泛的知識(shí)。我有來自物理的知識(shí),我也有生物的知識(shí)。所以我想把這些不同領(lǐng)域的知識(shí)結(jié)合起來。杰弗瑞的過人之處就在于他擁有令人贊嘆的知識(shí)。
而這里有一個(gè)關(guān)鍵,物理學(xué)非常擅長(zhǎng)建立世界模型。但是物理學(xué)沒有問的一件事是,這個(gè)世界在計(jì)算什么?你不會(huì)問這個(gè)問題對(duì)吧?因?yàn)槭澜鐩]有功能,世界存在本身也沒有目的。物理學(xué)的研究也沒有目的。你會(huì)問物理學(xué)研究的目的是什么嗎?重力的作用是什么嗎?換句話說,重力不是一個(gè)計(jì)算過程,只是一組自然遵循的方程。這就像是對(duì)世界正在發(fā)生的事情的描述。但是我發(fā)現(xiàn)我正在研究的這些大腦模型中缺少了什么,因?yàn)槲乙郧笆且粋€(gè)物理學(xué)家。所以我想讓我們做一個(gè)大腦模型吧,也許這會(huì)幫我們理解它。
但即使你有最好的模型,它也不會(huì)告訴你運(yùn)作原理是什么。為什么它會(huì)這樣運(yùn)作呢?研究它的原理是一個(gè)計(jì)算問題。它的目標(biāo)是什么?它想要做什么?這其實(shí)是計(jì)算機(jī)科學(xué)需要解決的問題。計(jì)算機(jī)科學(xué)實(shí)際上是一門研究如何通過計(jì)算來達(dá)到目標(biāo)的學(xué)科,算法會(huì)帶你找到答案。
而這就是我缺失的部分。你知道,我是個(gè)優(yōu)秀的物理學(xué)家,我也學(xué)到了很多關(guān)于大腦的知識(shí)。但是,神經(jīng)科學(xué)或物理學(xué)中沒有人會(huì)問關(guān)于“功能”的問題。但在生物學(xué)領(lǐng)域,人們會(huì)問這個(gè)問題。他們談?wù)撔袨楹蜕妗:苊黠@功能肯定存在,比如為了生存。然而,當(dāng)你談?wù)撋窠?jīng)元的功能時(shí),這是一個(gè)謎。我的意思是,沒有人知道為什么生物體把神經(jīng)元放在那里,它是怎么在那里的,為什么會(huì)有這么多的神經(jīng)元?我們?cè)噲D理解一些非常復(fù)雜的東西,一個(gè)沒有人理解的機(jī)器。
澎湃新聞:但你們可以模仿這個(gè)結(jié)構(gòu),然后給它數(shù)據(jù),它們就會(huì)自己學(xué)習(xí)。
特倫斯:是的。所以我想說,我希望中國(guó)讀者能夠從我的書中明白不要相信權(quán)威。我不信任權(quán)威。即使他們擁有所有的權(quán)力,也不意味著他們是對(duì)的。人要相信自己,你的直覺很重要。即使現(xiàn)在你沒有權(quán)力,或許有一天你會(huì)的。
澎湃新聞:我想知道深度學(xué)習(xí)發(fā)展的更高階段是什么?現(xiàn)在計(jì)算機(jī)還是需要大量的數(shù)據(jù)才能識(shí)別出杯子,但是我們的大腦只需要一兩個(gè)樣本,就可以認(rèn)出其他杯子。
特倫斯:這是個(gè)好問題,所以我們的方向在哪里?現(xiàn)在還缺少什么?我們的每個(gè)網(wǎng)絡(luò)都解決了一個(gè)問題。比如我們已經(jīng)有一個(gè)視覺網(wǎng)絡(luò),一個(gè)語音網(wǎng)絡(luò),還有一個(gè)語言網(wǎng)絡(luò)。我們還有一個(gè)運(yùn)動(dòng)系統(tǒng)網(wǎng)絡(luò)。
我們真正需要做的是想出一種全局的方法,來組織協(xié)調(diào)所有這些網(wǎng)絡(luò)。
因?yàn)槲覀兊拇竽X皮層有很多特殊的區(qū)域,負(fù)責(zé)一些特殊的事情,但無論如何它必須是一個(gè)操作系統(tǒng)。不同的部分在協(xié)作,信息在系統(tǒng)的不同部分之間流動(dòng)。這就是涉及到“意識(shí)”的問題。換句話說,這些特殊的系統(tǒng)之上肯定還存在一個(gè)層級(jí)。每一個(gè)獨(dú)立的領(lǐng)域有獨(dú)立的網(wǎng)絡(luò)。大腦中有無意識(shí)的部分嗎?你并不會(huì)意識(shí)到你的視覺,你也沒有語言意識(shí)。但不知何故,我就是可以看到你,可以聽到你,可以觸摸到你。當(dāng)把你放到一個(gè)背景中,我就可以我能認(rèn)出你臉上的表情。這些在我大腦的不同部位發(fā)生著,是一個(gè)協(xié)調(diào)的過程。
AI當(dāng)然會(huì)產(chǎn)生意識(shí),也絕對(duì)會(huì)帶來新的倫理問題
澎湃新聞:你書中談到AI最后會(huì)產(chǎn)生意識(shí),那么它會(huì)有情緒嗎?
特倫斯:一定會(huì)的。只是現(xiàn)在還沒有。其實(shí)我們知道大腦中有一部分負(fù)責(zé)情緒,只是我們還沒有把它們放到網(wǎng)絡(luò)中。但我們將會(huì)這么做的,這也是絕對(duì)必要的。我的意思是,如果你想要AI能夠和你互動(dòng),并且擁有相同的社會(huì)水平,它也必須有情感。這些都是已知的了,“擁有情緒”只是時(shí)間問題。而且這一切已經(jīng)在發(fā)生了,有人正在研究這個(gè)問題,意識(shí)也是一樣,一切都是自發(fā)的。
澎湃新聞:那他們和人類建立的紐帶會(huì)改變現(xiàn)在社會(huì)結(jié)構(gòu),并帶來很多倫理問題吧!
特倫斯:絕對(duì)會(huì),所以我們應(yīng)該做好準(zhǔn)備。我們不應(yīng)該等到它發(fā)生,而是提前做好準(zhǔn)備。所有的技術(shù)發(fā)展皆是如此。無論它們什么時(shí)候來到這個(gè)世界上,你都可以用它們來做好事,也可以用來做壞事。
澎湃新聞:但它們可能會(huì)成為最強(qiáng)的物種,那時(shí)候它們還會(huì)和人類協(xié)商嗎?
特倫斯:是我們創(chuàng)造了它們,我們才是老板。如果我們讓他們失控了,那么這是我們的問題。如果我們讓這樣的情況發(fā)生,我們就是愚蠢的了。
澎湃新聞:但有時(shí)候人類就是會(huì)犯蠢啊。
特倫斯:不是所有人都這樣,也不是一直都這樣。我有信心,作為一個(gè)物種,人類有足夠的智慧平穩(wěn)地避免最壞的結(jié)果。自從工業(yè)時(shí)代以來,我們所擁有的技術(shù)有時(shí)被用于戰(zhàn)爭(zhēng),也會(huì)被用于建設(shè)文明,還用來建設(shè)工廠。技術(shù)發(fā)展總會(huì)遇到問題,你要做的就是控制它。通過制定法律,來控制人們?yōu)E用技術(shù)獲利。這樣的困境總是會(huì)發(fā)生的。但所有的技術(shù)都是如此,人工智能也不例外。所以我想說,現(xiàn)在開始擔(dān)心并且考慮停下還為時(shí)過早。我不認(rèn)為僅僅因?yàn)閷砺飞峡赡軙?huì)遇到問題,你就停止前進(jìn)。比如無人駕駛汽車殺人的問題等,這都是我們可以解決的問題。因?yàn)檫@就是科技發(fā)展的規(guī)律。
澎湃新聞:我可以稱你為人工智能樂觀派嗎?
特倫斯:我是現(xiàn)實(shí)主義者。我的現(xiàn)實(shí)主義是建立在科技發(fā)展歷史的基礎(chǔ)上的。我想說的是在生物學(xué)中,也是一樣的道理。我們可以操縱基因,所以我們擁有控制自然的力量。這種力量非常強(qiáng)大,這甚至比人工智能更強(qiáng)大。
澎湃新聞:你能否簡(jiǎn)單介紹一下美國(guó)、中國(guó)和日本的人工智能發(fā)展情況?你在書中談到,覺得中國(guó)人工智能的發(fā)展是很大可能超過其他國(guó)家的。
特倫斯:我認(rèn)為這是“蘋果”和“桔子”的關(guān)系。我的意思就是你其實(shí)是在比較兩種不同的東西。換句話說,中國(guó)和美國(guó)的發(fā)展完全不同,就像在兩條不同的軌道上的火車。在美國(guó),人工智能是一種自下而上的研究。基本上所有的研究都是在公司的資助下進(jìn)行的,而不是政府。政府花的錢很少。資金全都來自大型互聯(lián)網(wǎng)公司,比如臉書(Facebook),國(guó)際商業(yè)機(jī)器公司( IBM)和微軟。他們的研究由市場(chǎng)驅(qū)動(dòng)的,這關(guān)于怎么用人們想要的方式把產(chǎn)品投入市場(chǎng)。比如蘋果手機(jī)想要語音識(shí)別和人臉識(shí)別的功能。人們想要這些功能。
但是在中國(guó),這是自上而下的發(fā)展,是一種完全不同的方式。每一種方法都有一定的優(yōu)勢(shì)。
澎湃新聞:可是我們也有許多來自企業(yè)的資本投入。
特倫斯:是的,但是這里的問題不是錢從哪里來,而是目標(biāo)是什么。誰決定了人工智能的目標(biāo)?我的意思是,公司可能可以控制資金,但是政府可能說,我就想讓你做人臉識(shí)別,這是權(quán)威的問題。但在美國(guó),每個(gè)人都是為了自己,每個(gè)人都努力研發(fā)出產(chǎn)品在市場(chǎng)中盈利。我的意思是,這兩種模式都在以不同的方式進(jìn)化,我們無法預(yù)測(cè)它們會(huì)在什么時(shí)候結(jié)束。很有可能是一個(gè)非常不同的結(jié)局,但現(xiàn)在我們還不知道。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。