楊立昆是當今世界頂尖的人工智能專家,為他的新書作序,頗具挑戰(zhàn)性。好在眾多專家已在人工智能領(lǐng)域探索了近70年,本文希望通過反思已走過路徑的合理性及局限性,探索人工智能的未來發(fā)展方向。
就像人可以分為精神和肉體兩個層次,機器智能也可以分為載體(具有特定結(jié)構(gòu)的機器)和智能(作為一種現(xiàn)象的功能)兩個層次,兩個層次同樣重要。因此,我偏好用機器智能這個概念替代人工智能。
與機器智能相比,人工智能這個概念的重心在智能。“人工”二字高高在上的特權(quán)感主導(dǎo)了人工智能研究的前半葉,集中體現(xiàn)為符號主義。符號主義主張(由人)將智能形式化為符號、知識、規(guī)則和算法,認為符號是智能的基本元素,智能是符號的表征和運算過程。
符號主義的思想起源是數(shù)理邏輯、心理學(xué)和認知科學(xué),并隨著計算機的發(fā)明而步入實踐。符號主義有過輝煌,但不能從根本上解決智能問題,一個重要原因是“紙上得來終覺淺”:人類抽象出的符號,源頭是身體對物理世界的感知,人類能夠通過符號進行交流,是因為人類擁有類似的身體。
計算機只處理符號,就不可能有類人感知和類人智能,人類可意會而不能言傳的“潛智能”,不必或不能形式化為符號,更是計算機不能觸及的。要實現(xiàn)類人乃至超人智能,就不能僅僅依靠計算機。
與符號主義自頂向下的路線針鋒相對的是連接主義。連接主義采取自底向上的路線,強調(diào)智能活動是由大量簡單單元通過復(fù)雜連接后并行運行的結(jié)果,基本思想是,既然生物智能是由神經(jīng)網(wǎng)絡(luò)產(chǎn)生的,那就通過人工方式構(gòu)造神經(jīng)網(wǎng)絡(luò),再訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)產(chǎn)生智能。
人工神經(jīng)網(wǎng)絡(luò)研究在現(xiàn)代計算機發(fā)明之前就開始了,1943年,沃倫·麥卡洛克和沃爾特·皮茨提出的M-P神經(jīng)元模型沿用至今。連接主義的困難在于,它并不知道什么樣的網(wǎng)絡(luò)能夠產(chǎn)生預(yù)期智能,因此大量探索歸于失敗。
20世紀80年代神經(jīng)網(wǎng)絡(luò)曾經(jīng)興盛一時,掀起本輪人工智能浪潮的深度神經(jīng)網(wǎng)絡(luò)只是少見的成功個案,不過這也是技術(shù)探索的常態(tài)。
人工智能的第三條路線是行為主義,又稱進化主義,思想來源是進化論和控制論。生物智能是自然進化的產(chǎn)物,生物通過與環(huán)境以及其他生物之間的相互作用發(fā)展出越來越強的智能,人工智能也可以沿這個途徑發(fā)展。
這個學(xué)派在20世紀80年代末90年代初興起,近年來頗受矚目的波士頓動力公司的機器狗和機器人就是這個學(xué)派的代表作。行為主義的一個分支方向是具身智能,強調(diào)身體對智能形成和發(fā)展的重要性。行為主義遇到的困難和連接主義類似,那就是什么樣的智能主體才是“可塑之才”。
機器學(xué)習(xí)從20世紀80年代中期開始引領(lǐng)人工智能發(fā)展潮流,本書給出了很通俗的定義:學(xué)習(xí)就是逐步減少系統(tǒng)誤差的過程,機器學(xué)習(xí)就是機器進行嘗試、犯錯以及自我調(diào)整等操作。機器學(xué)習(xí)對人工智能最重要的貢獻是把研究重心從人工賦予機器智能轉(zhuǎn)移到機器自行習(xí)得智能。近年來,最成功的機器學(xué)習(xí)方法是深度學(xué)習(xí)和強化學(xué)習(xí)。
深度學(xué)習(xí)是連接主義和機器學(xué)習(xí)相結(jié)合的產(chǎn)物,最大的貢獻是找到了一種在多層神經(jīng)網(wǎng)絡(luò)上進行機器學(xué)習(xí)的方法,本書作者楊立昆和約書亞·本吉奧、杰弗里·辛頓因此獲得2018年度圖靈獎。
深度學(xué)習(xí)首先回答了什么樣的神經(jīng)網(wǎng)絡(luò)可以訓(xùn)練出智能,包括多層神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),也回答了訓(xùn)練(學(xué)習(xí))方法問題,包括受限玻爾茲曼機模型、反向傳播算法、自編碼模型等。深度學(xué)習(xí)對連接主義的重大意義是給出了一條訓(xùn)練智能的可行途徑,對機器學(xué)習(xí)的重大意義則是給出了一個凝聚學(xué)習(xí)成效的可塑載體。
強化學(xué)習(xí)的思想和行為主義一脈相承,可追溯到1911年行為心理學(xué)的效用法則:給定情境下,得到獎勵的行為會被強化,而受到懲罰的行為會被弱化,這就是強化學(xué)習(xí)的核心機制——試錯。1989年,沃特金斯提出Q學(xué)習(xí),證明了強化學(xué)習(xí)的收斂性。
2013年,谷歌子公司DeepMind將Q學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)相結(jié)合,取得AlphaGo、AlphaZero(阿爾法元)和AlphaStar等重大突破。最近,DeepMind更是強調(diào),只需要強化學(xué)習(xí),就能實現(xiàn)通用人工智能。
與DeepMind極力推崇強化學(xué)習(xí)不同,楊立昆認為強化學(xué)習(xí)不過是錦上添花,傳統(tǒng)監(jiān)督學(xué)習(xí)標注成本高,泛化能力有限,也只是點綴,自監(jiān)督學(xué)習(xí)才是機器學(xué)習(xí)的未來。
自監(jiān)督學(xué)習(xí)是通過觀察發(fā)現(xiàn)世界內(nèi)在結(jié)構(gòu)的過程,是人類(以及動物)最主要的學(xué)習(xí)形式,是“智力的本質(zhì)”,這就是本書第九章的核心觀點。最近,楊立昆和另外兩位圖靈獎獲得者發(fā)表的論文Deep Learning for AI(《面向人工智能的深度學(xué)習(xí)》)中,也重點談了這個觀點。
有了三位圖靈獎獲得者的大力倡導(dǎo),相信自監(jiān)督學(xué)習(xí)將會掀起一波新的研究浪潮,但我不認為這就是“智力的本質(zhì)”。根本原因在于,這只是從機器學(xué)習(xí)層次看問題,或者更一般地說,是從功能層次看問題。我認為,學(xué)習(xí)方法(功能)固然重要,從事學(xué)習(xí)的機器(結(jié)構(gòu))同樣重要,甚至更重要,因為結(jié)構(gòu)決定功能。正如我開始時強調(diào)過的,永遠不要忘記作為智能載體的機器。
楊立昆在第九章開篇提到了法國航空先驅(qū)克萊芒·阿代爾,他比萊特兄弟早13年造出了能飛起來的載人機器。楊立昆從這位先驅(qū)身上看到的主要是教訓(xùn):“我們嘗試復(fù)制生物學(xué)機制的前提是理解自然機制的本質(zhì),因為在不了解生物學(xué)原理的情況下進行復(fù)制必然導(dǎo)致慘敗?!?/p>
他的立場也很清楚:“我認為,我們必須探究智能和學(xué)習(xí)的基礎(chǔ)原理,不管這些原理是以生物學(xué)的形式還是以電子的形式存在。正如空氣動力學(xué)解釋了飛機、鳥類、蝙蝠和昆蟲的飛行原理,熱力學(xué)解釋了熱機和生化過程中的能量轉(zhuǎn)換一樣,智能理論也必須考慮到各種形式的智能?!?/p>
我的看法和他不同,我認為克萊芒·阿代爾(和萊特兄弟)不僅沒有“慘敗”,而且取得了偉大的成功。
原因很簡單:克萊芒·阿代爾1890年和萊特兄弟1903年分別發(fā)明飛機,而空氣動力學(xué)是1939—1946年才建立起來的。兩次世界大戰(zhàn)中發(fā)揮重大作用的飛機,主要貢獻來自克萊芒·阿代爾和萊特兄弟的工程實踐,而不是空氣動力學(xué)理論的貢獻,因為空氣動力學(xué)還沒出現(xiàn)。
另一個基本事實是,至今空氣動力學(xué)也沒能全面解釋飛機飛行的所有秘密,更沒有全面解釋各種動物的飛行原理??諝鈩恿W(xué)很偉大,但它是“事后諸葛亮”,對于優(yōu)化后來的飛機設(shè)計意義重大,但它不是指導(dǎo)飛機發(fā)明的理論導(dǎo)師。
智能比飛行要復(fù)雜得多,深度學(xué)習(xí)成功實現(xiàn)了智能,但是能夠解釋這種成功的理論還沒出現(xiàn),我們并不能因此否定深度學(xué)習(xí)的偉大意義。楊立昆和另外兩位圖靈獎獲得者的偉大,和克萊芒·阿代爾及萊特兄弟之偉大的性質(zhì)相同。
我們當然要追求智能理論,但是不能迷戀智能理論,更不能把智能理論當作人工智能發(fā)展的前提。如果這里的智能理論還試圖涵蓋包括人類智能在內(nèi)的“各種形式的智能”,則這種理論很可能超出了人類智能可理解的范圍。
所以,盡管自監(jiān)督學(xué)習(xí)是值得探索的一個重要方向,它也只是探索“智力的本質(zhì)”漫漫長途中的一個階段。
人類和很多動物具有自監(jiān)督學(xué)習(xí)能力,并不是自監(jiān)督學(xué)習(xí)多神奇,而是因為他(它)們擁有一顆可以自監(jiān)督學(xué)習(xí)的大腦,這才是智力的本質(zhì)所在。機器要進行自監(jiān)督學(xué)習(xí),也要有自己的大腦,至少要有深度神經(jīng)網(wǎng)絡(luò)那樣的可塑載體,否則自監(jiān)督學(xué)習(xí)無從發(fā)生。
相比之下,強化學(xué)習(xí)的要求簡單得多,一個對溫度敏感的有機大分子就能進行強化學(xué)習(xí),這正是生命和智能出現(xiàn)的原因。所以,強化學(xué)習(xí)才是更基本的學(xué)習(xí)方法。
當然,從零開始強化學(xué)習(xí),確實簡單粗暴、浪費巨大,這也是強化學(xué)習(xí)思想提出百年并沒取得太大進展的重要原因。強化學(xué)習(xí)近十年來突然加速,是因為有了深度神經(jīng)網(wǎng)絡(luò)作為訓(xùn)練的結(jié)構(gòu)基礎(chǔ),因而在圍棋、《星際爭霸》等游戲中超越人類。不過,人類輸?shù)貌⒉恍母是樵?,抱怨的主要理由是機器消耗的能源遠高于人類大腦。
我認為這種抱怨是片面的,人類棋手大腦的功耗確實只有數(shù)十瓦,但訓(xùn)練一個人類棋手要花費十多年時間。更重要的是,人類棋手學(xué)圍棋時是帶著大腦這個先天基礎(chǔ)的,這顆大腦是億萬年進化來的,消耗了巨大的太陽能,這都應(yīng)該記到能耗的總賬中。這樣比較,到底是機器棋手還是人類棋手能耗更大呢?
從節(jié)省能源角度看,機器智能確實不應(yīng)該從頭再進化一次,而是應(yīng)該以進化訓(xùn)練好的生物神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),這就是純粹的連接主義:構(gòu)造一個逼近生物神經(jīng)網(wǎng)絡(luò)的人工神經(jīng)網(wǎng)絡(luò)。
1950年,圖靈的開辟性論文《計算機與智能》中就表達了這個觀點:“真正的智能機器必須具有學(xué)習(xí)能力,制造這種機器的方法是,先制造一個模擬童年大腦的機器,再教育訓(xùn)練它?!边@也是類腦智能或神經(jīng)形態(tài)計算的基本出發(fā)點。
相關(guān)科研實踐開始于20世紀80年代,基本理念就是構(gòu)造逼近生物神經(jīng)網(wǎng)絡(luò)的神經(jīng)形態(tài)光電系統(tǒng),再通過訓(xùn)練與交互,實現(xiàn)更強的人工智能乃至強人工智能。
除了改進訓(xùn)練對象的先天結(jié)構(gòu),訓(xùn)練不可或缺的另一個要素是環(huán)境。環(huán)境才是智能的真正來源,不同環(huán)境孕育不同智能。人們往往把今天人工智能系統(tǒng)的成功歸結(jié)為三個要素:大數(shù)據(jù)+大算力+強算法,其中數(shù)據(jù)是根本,另外兩個要素主要影響效率。訓(xùn)練更強智能,需要更大數(shù)據(jù),這是智能發(fā)展的基本規(guī)律。
但即便是大數(shù)據(jù),也不能完整有效地表達環(huán)境,數(shù)字孿生能更全面地刻畫物理環(huán)境,更好地保留環(huán)境自有的時空關(guān)系,因此也能夠哺育出更強的人工智能。物理世界的模型化本來就是科學(xué)最核心的任務(wù),以前從中發(fā)現(xiàn)規(guī)律的是人類,未來這個發(fā)現(xiàn)主體將擴展到機器。
行文至此,我們已經(jīng)從人工智能發(fā)展史中小心翼翼地挑出三根靠得住的基本支柱:一是神經(jīng)網(wǎng)絡(luò),二是強化學(xué)習(xí),三是環(huán)境模型。在這三根支柱中,楊立昆最突出的貢獻是對神經(jīng)網(wǎng)絡(luò)的貢獻,特別是卷積神經(jīng)網(wǎng)絡(luò)。至于想到用卷積神經(jīng)網(wǎng)絡(luò),是因為借鑒了生物神經(jīng)感知系統(tǒng),這就是卷積神經(jīng)網(wǎng)絡(luò)在圖像識別和語音識別等領(lǐng)域大獲成功的主要原因——深度神經(jīng)網(wǎng)絡(luò)已經(jīng)借鑒了生物神經(jīng)網(wǎng)絡(luò)的部分結(jié)構(gòu)。
總而言之,人工智能經(jīng)典學(xué)派有三個:符號主義、連接主義和行為主義。符號描述和邏輯推理不是智能的基礎(chǔ),而是一種表現(xiàn),讀寫都不會的文盲就擁有的“低級”智能才更基礎(chǔ)。因此,連接主義和行為主義雖然困難重重,但有著更強的生命力,從中發(fā)展出的深度學(xué)習(xí)和強化學(xué)習(xí)兩套方法,成為當今支撐人工智能的兩大主要方法。
最后需要強調(diào)的是,人類智能是地球環(huán)境培育出的最美麗的花朵,我們在為自己驕傲的同時,也要警惕人類中心主義。
來源:《中國科學(xué)報》