高山大學(xué)2019年經(jīng)典課程
授課老師:
特倫斯·謝洛夫斯基:人工智能科學(xué)家,美國國家科學(xué)院院士、美國國家醫(yī)學(xué)院院士、美國國家工程院院士、美國國家藝術(shù)與科學(xué)學(xué)院院士、美國物理學(xué)會會士、國際電氣與電子工程師協(xié)會(IEEE)會士。
張宏江:高山大學(xué)創(chuàng)始校董,校董會終身榮譽主席?,F(xiàn)任源碼資本投資合伙人,曾任金山集團CEO、微軟亞太研發(fā)集團(ARD)首席技術(shù)官及微軟亞洲工程院(ATC)院長,微軟“杰出科學(xué)家”之一。是世界多媒體和人工智能研究領(lǐng)域一流的科學(xué)家,計算機視頻檢索研究領(lǐng)域的開山鼻祖。
※以下為特倫斯院士課程《智能時代的深度學(xué)習(xí)和核心驅(qū)動力》,文稿內(nèi)容約為現(xiàn)場內(nèi)容十分之一
很高興跟大家見面,非常開心有這個機會與大家一起探討人工智能(AI)。
在過去的這些年里,人工智能技術(shù)風(fēng)靡全球。80年代我從事AI研究的時候,絕不可能想到我會來中國跟大家討論這項技術(shù)帶來的重大改變。
就在幾天前,計算機科學(xué)里的最高榮譽——圖靈獎,頒給了我的老朋友Geoffrey E Hinton,Yoshua Bengio和Yann LeCun,這相當(dāng)于計算機界的諾貝爾獎,贊譽極高。
△2018年圖靈獎得主
20世紀(jì)前半葉,最振奮的科學(xué)突破來自于基礎(chǔ)物理學(xué),愛因斯坦發(fā)現(xiàn)的相對論。
20世紀(jì)下半葉,重大的突破主要集中在分子生物學(xué)。尤其是沃森和克里克發(fā)現(xiàn)了DNA的雙螺旋結(jié)構(gòu),人類首次認識到DNA是生命的基礎(chǔ)。由此,我們也開始研發(fā)出了新的技術(shù)和手段對DNA進行編輯,以便于更好地探索細胞的復(fù)雜性。
21世紀(jì)前半葉,最讓我們振奮的科學(xué)突破又是什么呢?
也許因為我們身處其中無法判斷,但我認為所有令人興奮的發(fā)現(xiàn)都與信息技術(shù)有關(guān)。
有了計算機科學(xué)之后,我們進入了一個全新的信息時代。信息學(xué)成為了我們不斷積累、分析,進而推演出有趣算法的一個領(lǐng)域。
人體內(nèi)終極的信息系統(tǒng)是大腦,可以說當(dāng)前是神經(jīng)系統(tǒng)的黃金時代,我們有強大的技術(shù)和手段,還有海量的數(shù)據(jù)可以去分析基因組,分析腦內(nèi)的神經(jīng)元。
2001年,第一個人類基因組測序花了30億美元,而現(xiàn)在只要1000美元就可以做到,這就是大數(shù)據(jù)帶來的巨大進步。
△萊特兄弟在基蒂霍克做飛行試驗
我想從萊特兄弟講起。他倆都是工程師,共同經(jīng)營著一家自行車店。怎么提高自行車的效率是那個時候工程師們最關(guān)注的事情。其實計算機科學(xué)家也是一樣的,本質(zhì)上是在關(guān)注人類如何去思考,如何做決策這樣的問題。
飛機研發(fā)初期,人們希望能夠模仿鳥類來實現(xiàn)飛行的夢想。
萊特兄弟研究飛機的時候,花了很長時間去觀察鳥。他們發(fā)現(xiàn)鳥類在滑行的時候,可以不用扇動翅膀,只需借助風(fēng)的力量就能夠飛翔。于是就考慮模仿鳥類滑翔的機制來制造飛機。
分享萊特兄弟的故事,是想告訴大家,我們向自然界學(xué)習(xí),并不是學(xué)每一個細節(jié),而是從原則上進行借鑒。
這就好像是計算機科學(xué)剛起步的時候,大家都希望能模仿人腦。但事實上計算機的運行機制和大腦的機制是不一樣的。
大腦中有數(shù)十億的神經(jīng)元,它們是異步工作的,不遵循時間的設(shè)計,做著獨立的決策。這一點是芯片無法做到的。
如何利用人工智能系統(tǒng)來進行計算?這是我們的研究方向。
人類可以通過經(jīng)驗進行知識更新、信息更新,我們?nèi)绾巫岆娔X也具有這樣的功能呢?
大腦神經(jīng)元之間互相連接之后,學(xué)習(xí)得到了加強,同時也可以吸收外部世界的大量數(shù)據(jù)進行整理,從而去解決一些問題。
我覺得這是計算機可以借鑒的。
1958年,康奈爾大學(xué)的弗蘭克·羅森布拉特發(fā)明了一種看似簡單的網(wǎng)絡(luò)感知器算法,感知器是具有單一人造神經(jīng)元的神經(jīng)網(wǎng)絡(luò),它有一個輸入層以及將輸入單元和輸出單元相連的一組連接。感知器的目標(biāo)是確定輸入的圖案是否屬于某一類別。
△感知器
羅森布拉特發(fā)明的這個算法可以解決現(xiàn)實問題。比如應(yīng)用在男女性面部識別上。
首先用大量的示例圖片對算法進行訓(xùn)練,如果計算錯了,就重新開始,校正權(quán)重,直到得出正確輸出結(jié)果。
△面部識別
作為人類,我們可以通過人的第二性征來判斷性別,但如果去掉頭發(fā)、胡須、首飾等,可能我們就無法判斷了。
但是感知器不一樣,樣本越大,輸出結(jié)果的正確率就越高,與其他因素沒有太大關(guān)系,這就是感知器的優(yōu)勢。
但感知器也有它的局限性,那就是它只能解決線性的問題,對非線性的問題則束手無策。
對此,Geoffrey E Hinton和我一起發(fā)明了玻爾茲曼機,玻爾茲曼機中有二進制隱藏單元和可見單元,單元可以對我們的信息進行加工,投射到輸出部分。從某種意義上說,這是大腦將感覺輸入轉(zhuǎn)化為運動輸出。
早在20世紀(jì)80年代,計算機的成本很高,而且計算速度很慢,隨著時間推移,計算成本逐漸下降,人們擁有了更大的網(wǎng)絡(luò),也可以在更大的數(shù)據(jù)集上訓(xùn)練它。
但其實這是一件很困難的事情,解決現(xiàn)實世界問題所需的程序規(guī)模是相當(dāng)巨大的,視覺處理不僅要計算位置、大小和方向的差異,還必須根據(jù)對象的不同特性來區(qū)別它們。人們很多次的努力都失敗了。
2012年出現(xiàn)了一個轉(zhuǎn)折點,計算和機器學(xué)習(xí)解決視覺問題的成本開始低于比程所需的成本。
這一年,Yann LeCun提出了使用卷積神經(jīng)網(wǎng)絡(luò)進行圖片分類的算法。最開始這種算法并不成功,但經(jīng)歷了很長時間的發(fā)展后,許多計算機都采用了這種算法,隨著數(shù)據(jù)樣本越來越大,他們的處理系統(tǒng)也越來越好。
卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)是基于卷積的,卷積可以被想象成一個小的滑動濾波器,在劃過整張圖像的過程中創(chuàng)建一個特征層。隨著進入特征層的樣本越來越多,輸出的結(jié)果就會更加地準(zhǔn)確。
麻省理工詹姆斯·狄卡羅比較了猴子視覺皮層層級結(jié)構(gòu)中不同神經(jīng)元和深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中的單元。
他發(fā)現(xiàn)第一層中圖像卷積的濾波器,與視覺皮層中的“簡單細胞”類似,超過第一層之后,更高層次的濾波器則會進入復(fù)雜的視覺處理階段,對復(fù)雜的特征做出響應(yīng)和解碼。
他得出的結(jié)論是:深度學(xué)習(xí)網(wǎng)絡(luò)中每層神經(jīng)元的統(tǒng)計特性,與皮層層級結(jié)構(gòu)中神經(jīng)元的統(tǒng)計特性非常接近。
當(dāng)時做實驗的時候,由于對大腦的認知不夠,我們并不理解動物的視覺系統(tǒng)為什么能夠做出相應(yīng)的分析,但是后來通過深度學(xué)習(xí)網(wǎng)絡(luò)的分層分析,我們追蹤信息流一層到另一層的轉(zhuǎn)變,開始可以反過來分析大腦中的神經(jīng)元。
所以,深度學(xué)習(xí)能夠加深我們對于大腦神經(jīng)元的認識。而與此同時,對大腦的認識又進一步激發(fā)了我們對于機器學(xué)習(xí)的設(shè)計,所以這個過程是非常強大的,可以幫助我們更好地強化對兩方面的理解。
識別圖像是深度學(xué)習(xí)的第一步,我們真正想做的是建立起一種能夠理解復(fù)雜場景的模式。
這需要深度學(xué)習(xí)能夠為圖片做標(biāo)注。即先標(biāo)記圖片中的對象,將其傳遞給循環(huán)神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò)輸出適當(dāng)?shù)挠⑽膯卧~串。
在這個過程中,我們會用到注意力(白色云)來表示照片中的單詞的指示對象,例如圖中的“飛盤”“狗”“指示牌”等等。
對于圖中不同的場景,輸出的結(jié)果有“一個女人在公園里扔飛盤”“一只小狗站在地板上”“路上有一個停止標(biāo),背景有一座山”等等。這些輸出結(jié)果不僅英文句式正確,而且語義也沒有問題。
語言也是人類特有的能力。動物也有它們自己的溝通方式,但是并沒有像人類一樣有語義的系統(tǒng)。
研究語言方面,我們做的一件事是訓(xùn)練一個網(wǎng)絡(luò),來預(yù)測句子中的下一個詞是什么。我們希望進入到網(wǎng)絡(luò)中,看看每個詞的內(nèi)部結(jié)構(gòu)可能是什么樣子,了解它是如何做預(yù)測的。
這個系統(tǒng)有很多層的網(wǎng)絡(luò),最后做得也很成功。
這個網(wǎng)絡(luò)中有10萬個單元,20個層,我們分析了每一個詞背后的活動規(guī)律,觀察在10萬維度下,不同詞之間有什么樣的聯(lián)系,這是超出我們傳統(tǒng)幾何學(xué)理解范圍的。
把多維空間中的詞投影到二維平面上,我們可以看到,所有國家的詞都聚集在一起,而首都的詞也都聚集在一個范圍內(nèi)。
我們試圖建立起國家和首都的矢量關(guān)系,比如將俄羅斯和莫斯科對應(yīng)起來,而當(dāng)我們把連接挪到意大利時,箭頭自動的就會對應(yīng)到羅馬。
這不是一個巧合,沒有任何人告知系統(tǒng)這個算法,但是系統(tǒng)自動就開始根據(jù)類型進行分組。
雖然它并不知道不同詞匯之間的關(guān)系,但是依舊跨越空間維度建立了聯(lián)系,這說明運算系統(tǒng)已經(jīng)開始涉足到語義的研究中了。
由此大家開始研究文字的嵌入,在多維度的系統(tǒng)中嵌入文字后,就可以借助系統(tǒng)的學(xué)習(xí)能力去解決一系列的語義問題。
讓我們震撼的是語言的翻譯,語言翻譯是人工智能的一只圣杯,因為它依賴于理解句子的能力。
谷歌最新版的翻譯軟件,代表了自然語言翻譯質(zhì)量的重大飛躍,因為它不再是以詞組為單位進行翻譯,而是升級到了語意完整的句子。
我們現(xiàn)在正在更加深度地分析翻譯網(wǎng)絡(luò)狀態(tài)內(nèi)部的進程究竟是什么樣的,很有可能在未來的某一天,我們不需要借助語言的學(xué)習(xí),就能夠讀懂其他的語言。
這張圖里體現(xiàn)的是許多不同的句子,每個句子標(biāo)有不同的顏色,這有點像是一個百萬維度的空間。
我們很難理解這個多維空間下的結(jié)構(gòu)是什么,但我們發(fā)現(xiàn),這個空間中不斷地有小集群出現(xiàn),我們把集群放大,可以看到這個系統(tǒng)在訓(xùn)練不同語種之間的翻譯。
比如我們可以看到,這里訓(xùn)練的是英語到韓語和日語之間的翻譯,并沒有訓(xùn)練日語到韓語的翻譯。
但出人意料的是,如果我們輸入了一句韓語,居然可以得出一句正確的日語句子。
這顛覆了我們對于句法的理解,而且這個過程真的是非常地神秘。
不光是3種語言之間的轉(zhuǎn)化,把20種語言納入到同一個網(wǎng)絡(luò)中,也可以實現(xiàn)這樣的結(jié)果。
如此復(fù)雜的網(wǎng)絡(luò)聯(lián)系,這個網(wǎng)絡(luò)是如何做到的呢?
這個網(wǎng)絡(luò)系統(tǒng)似乎通過某種方式把所有的語言轉(zhuǎn)化成了中間語言,中間語言可以在不同語言之間進行更好的轉(zhuǎn)化。
這對語言學(xué)專家來說絕對是非常吃驚的:因為這個網(wǎng)絡(luò)可以自己分析出不同語言之間的底層結(jié)構(gòu)。
翻譯機器能做到的是對輸入的內(nèi)容進行轉(zhuǎn)換,繼而進行輸出。但是人類的大腦并不是這樣的工作機制,我們通常會接收多方面的信息,然后進行各種思想活動,甚至通過聯(lián)想來生成結(jié)果,這是一個本能的過程。
模仿大腦的這種機制,就有了“生成式對抗網(wǎng)絡(luò)”,它可以自己產(chǎn)生活動。其實相當(dāng)于同時存在的兩個卷積網(wǎng)絡(luò),一個是生成卷積網(wǎng)絡(luò),一個是判別卷積網(wǎng)絡(luò)。
生成卷積網(wǎng)絡(luò)可以通過嘗試欺騙另一個卷積神經(jīng)網(wǎng)絡(luò)來訓(xùn)練生成優(yōu)質(zhì)的圖像樣本,后者必須決定一個輸入的樣本是真實的還是虛假的。
比如說一個網(wǎng)絡(luò)根據(jù)火山的結(jié)構(gòu)和外觀,自己合成許多火山的圖片,另外一個網(wǎng)絡(luò)就會判斷這些圖片的真實性。
由于兩個網(wǎng)絡(luò)的緊張對抗,會讓輸出的圖片具有令人難以置信的真實感。以下這些照片都是通過合成得到的。
通過不斷地改變生成式網(wǎng)絡(luò)的輸入向量,就有可能逐漸改變圖像,甚至?xí)a(chǎn)生混合效果。
這項技術(shù)正在迅速發(fā)展,可以想象,經(jīng)過訓(xùn)練的新一代對抗網(wǎng)絡(luò),應(yīng)該有可能直接創(chuàng)造出由已經(jīng)過世的演員或者是從未存在過的演員出演的電影。
2016年,圍棋的衛(wèi)冕冠軍,中國圍棋選手柯潔認為AlphaGo肯定贏不了他,2017年對戰(zhàn)AlphaGo失敗,他說:“去年我認為AlphaGo贏不了我,是因為我發(fā)現(xiàn)它的玩法和人類很像,但是現(xiàn)在,它的玩法就像是神一般,它創(chuàng)造了人類從來沒用過的招數(shù)?!?/p>
這給我們敲了一個警鐘,人工智能不僅會復(fù)制人類的東西,還會生成一些新的東西。
△啤酒瓶彎道
在汽車行業(yè),2008年,無人駕駛汽車就能夠順利地通過“啤酒瓶彎道”;
在幼兒教學(xué)過程中,使用機器人能夠吸引孩子們的注意力,照顧到每一個孩子,協(xié)助教學(xué)。
未來人們不用擔(dān)心機器人會取代我們,深度學(xué)習(xí)會讓人類更智能,我們完全可以與人工智能友好相處。
2013年,奧巴馬推出美國十年的“腦計劃”,要大力推動關(guān)于大腦神經(jīng)網(wǎng)絡(luò)的研究。從分子到突觸到神經(jīng)網(wǎng)絡(luò),了解大腦活動的各種復(fù)雜機制,繼而轉(zhuǎn)移到深度學(xué)習(xí)網(wǎng)絡(luò)中,反過來,通過對深度學(xué)習(xí)網(wǎng)絡(luò)的研究來更好地理解人類的各種行為。
我們對大腦的認識目前來看還是非常少的,人的大腦里沒有任何光線,也沒有傳感器,但是我們在觀測阿爾茲海默癥患者腦活動的時候發(fā)現(xiàn),當(dāng)人什么都不做的時候,大腦有的區(qū)域會自動激活,我們并不知道大腦里發(fā)生了什么。
我們觀測斑馬魚腦活動時,發(fā)現(xiàn)大腦內(nèi)差不多有8萬多個神經(jīng)元會同時被激活,這說明動物和人一樣,也在進行思考。但是在沒有傳感器的情況下,它們是怎么激活的呢?大腦內(nèi)測量到的信號又該如何去解讀呢?這都是未來“腦計劃”希望解決的問題。
△高山夜話
張宏江:非常感謝特倫斯精彩的介紹,給我們講了很多神經(jīng)科學(xué)和深度學(xué)習(xí)之間的關(guān)系。你的演講中提到人們通過學(xué)習(xí)大腦的工作模式來給機器賦予計算、思考甚至是決策的能力,但就目前的技術(shù)水平而言,我們對大腦的工作機制其實了解得非常少,這種情況下,深度學(xué)習(xí)是怎么走到現(xiàn)在的?
特倫斯:我們對大腦的知識了解很多,知道大腦的每一個分子結(jié)構(gòu),知道大腦不同組成部分是如何運作的。但是我們還有很多不了解的,比如大腦神經(jīng)網(wǎng)絡(luò)是如何互相聯(lián)系,如何產(chǎn)生活動的。因此我們希望發(fā)展更多的工具比如計算機,來更進一步地了解神經(jīng)科學(xué)這個層面的一些知識。
觀察視覺系統(tǒng)中每個神經(jīng)元的反應(yīng),可以看到神經(jīng)元是如何一步步傳遞神經(jīng)信號的,現(xiàn)在通過深度學(xué)習(xí),可以復(fù)制這個過程。這樣一來,我們就能夠更清楚地了解大腦。
但是就像我剛才講到的關(guān)于鳥和飛機的例子,雖然飛機是模仿了鳥類造出來的,但是飛機卻做不到像鳥一樣從一個枝頭飛到另外一個枝頭,飛機只能是直線飛行,而有些東西是比飛機更為復(fù)雜。
我們學(xué)習(xí)的是大腦的原理,而不是細節(jié)。在多年觀察的基礎(chǔ)上,從現(xiàn)象中抽象出隱含的約束條件,這就是深度學(xué)習(xí)發(fā)展起來的基本方法。
張宏江:您剛才提到了有許多數(shù)學(xué)家開始對神經(jīng)網(wǎng)絡(luò)進行了數(shù)學(xué)分析,這其實是理論滯后實踐。從科學(xué)發(fā)展的進程來看,尤其是物理學(xué)和電子學(xué)的發(fā)展過程中是理論領(lǐng)先,從而指導(dǎo)了實驗和設(shè)計,但在深度學(xué)習(xí)的發(fā)展上似乎這個過程正好相反。
特倫斯:舉個例子來說,250年前,瓦特發(fā)明了蒸汽機,他當(dāng)時是運用直覺做到了這一點,并沒有使用熱力學(xué)。實際上熱力學(xué)理論很早就已經(jīng)存在了,后來被用來不斷地該進蒸汽機??梢哉f,它助力了物理學(xué)的發(fā)展,開啟了工業(yè)革命。
另外一個反面的例子就是約瑟夫·傅里葉,大概250-240年前,他一直嘗試著解熱力方程,并且發(fā)現(xiàn),如果使用一系列展開式,每一項都是一個解,把每項系數(shù)相加,就能得到解此方程式的函數(shù)。
因此他將自己的發(fā)現(xiàn)寫了出來,并向法國數(shù)學(xué)期刊雜志投稿,但遭到了數(shù)學(xué)家的拒絕,認為這不是數(shù)學(xué)函數(shù)。其實現(xiàn)在我們知道,這是一種很好的分析方法,這是數(shù)學(xué)上非常輝煌的方法,兩百多年來,這種方法已經(jīng)應(yīng)用到了很多問題上。
張宏江:我比較驚訝的是,AI已經(jīng)發(fā)展近30年,有那么多的數(shù)學(xué)家在研究這個,他們也有非常好的數(shù)學(xué)工具,為什么他們沒有提出深度學(xué)習(xí)這個算法呢?
特倫斯:你知道,人都有思維障礙的。在深度學(xué)習(xí)方面,一個非常有影響的人的反對,可能會影響幾代科學(xué)家的工作。
張宏江:可以說,深度學(xué)習(xí)是人工智能的里程碑,2018年圖靈獎授予深度學(xué)習(xí)的專家也印證了這一點。深度學(xué)習(xí)解決了過去很多無法解決的問題。你覺得這意味著一個輝煌時代的結(jié)束,另外一個新的時代的開端嗎?還是說,人工智能有可能會迎來一個10-20年的黑暗時代呢?
特倫斯:我覺得,我們的理論發(fā)展其實停滯了多年,我們的發(fā)展模式是起起伏伏的,但是我可以斷定,不會永遠都這樣的。
張宏江:1979年你預(yù)測了神經(jīng)網(wǎng)絡(luò)和AI將會在2015年有突破性的發(fā)展,那個時候你是完全依據(jù)摩爾定律預(yù)測到了2015年計算機能夠滿足神經(jīng)網(wǎng)路的計算需求。
現(xiàn)實中情況是,2015年中國的孫劍研究團隊開發(fā)的ResNet在圖像識別(ImageNet)競賽中超過了人類的識別能力。你預(yù)測非常準(zhǔn)確,很了不起!
現(xiàn)在我們看到越來越多的人工智能的應(yīng)用,人工智能在很多應(yīng)用中可以說已經(jīng)戰(zhàn)勝了人類。那么,你能預(yù)測一下未來10年里,人工智能會對人們的生活帶來什么樣的改變嗎?
特倫斯:在此之前我想先問你一個問題,上世紀(jì)90年代,互聯(lián)網(wǎng)問世,那是它只用于軍事和學(xué)術(shù)目的。直到一款叫做Mosaic的瀏覽器出現(xiàn),互聯(lián)網(wǎng)商業(yè)化才開始了。當(dāng)你第一次用瀏覽器的時候,你能夠預(yù)測到瀏覽器會對我們生活的方方面面都產(chǎn)生影響嗎?
張宏江:我肯定不會預(yù)測到,但是我可能會預(yù)測圖書館會消失,因為我們可以在網(wǎng)上獲得各種各樣的知識,所以我覺得圖書館可能會消失,但是我預(yù)測錯了,現(xiàn)在圖書館還在。
特倫斯:確實,當(dāng)有新技術(shù)出現(xiàn)的時候,人們是無法想象他將來會如何使用這項技術(shù),甚至是連發(fā)明人自己都想象不到。
最早的電視機發(fā)明出來的時候,當(dāng)時記者就問電視的發(fā)明者:電視將來要怎么用?對世界的影響是什么?他當(dāng)時說會給電話帶來革命性的變化。
但其實電視的影響力遠不止如此,所以你看,其實這是沒有辦法做預(yù)測的。
張宏江:在中國,在北京,有很多芯片生產(chǎn)商。您覺得人工智能芯片會大爆發(fā)嗎?人工智能芯片和普通芯片有什么區(qū)別?
特倫斯:人工智能芯片可以優(yōu)化神經(jīng)運算系統(tǒng)。現(xiàn)在我們的芯片設(shè)計已經(jīng)非常靈活,可以做集群分析和樹分析等等,機器學(xué)習(xí)中的許多其他算法也可以用作特殊的目的。
現(xiàn)在很多芯片存在最大的問題是能耗高,如果能把能耗降低哪怕10%,也能節(jié)省不少成本。所以新一代的芯片主要關(guān)注在能耗方面。
人腦的神經(jīng)元是非數(shù)字的,每秒鐘都在進行大量的運算,但是耗能卻非常低,還能實現(xiàn)異步運算,這一點是芯片遠遠比不上的。
加州理工學(xué)院Carver Mead是人工智能芯片的先驅(qū)者之一,他利用模擬電路模仿生物神經(jīng)系統(tǒng)結(jié)構(gòu)。新一代的人工智能芯片價格便宜,耗能逐漸降低,只需要8位精度,不需要64位,不需要整體的時鐘,而且也能實現(xiàn)異步運算的功能。
現(xiàn)在有上千家的公司在做這個事情,針對個性化的需求,開發(fā)出非常多的應(yīng)用程序,并且?guī)缀趺刻於荚跀U張。所以在未來,英偉達的人工智能芯片的市場前景應(yīng)該不樂觀。
張宏江:你覺得未來會有類腦芯片的出現(xiàn)嗎?
特倫斯:不用等到未來,類腦芯片或者說是強化芯片就要出現(xiàn)了,很多公司已經(jīng)開始在做這些事情了。
我們不能用錯誤的問題來訓(xùn)練強化芯片,所以我實驗室的一個研究生做了這么一個實驗,在反向傳播算法中,用強化單元去替換任何一個連續(xù)網(wǎng)絡(luò),然后進行擴展,使它在網(wǎng)絡(luò)中的所有權(quán)重都增加一個定量。
實驗結(jié)果表明,經(jīng)過訓(xùn)練后,分級網(wǎng)絡(luò)幾乎無法辨別強化網(wǎng)絡(luò)的性能區(qū)別,這意味著我們可以交換更加復(fù)雜的多層網(wǎng)絡(luò),然后用一定的能量來提高其性能。
張宏江:剛才講了很多圖靈獎的情況,您和獲獎?wù)逪inton有過多年的合作,你對他了解嗎?能不能講講他有些什么讓你難忘的特質(zhì)?
特倫斯:他是我最好的朋友,他與中國很有淵源。我們共同發(fā)明了玻爾茲曼機,我們建立了能夠跟人腦的逐層分析能力進行關(guān)聯(lián)的機制。我們當(dāng)時深信已經(jīng)把人腦的機制弄明白了,但是當(dāng)時我們意識到計算能力遠遠不夠,所以需要很長時間來繼續(xù)推進。
所以,我們當(dāng)時我們各自面臨著一個重要的職業(yè)決定。我做出的判斷是我等不到2015年了。所以我當(dāng)時就決定,我要進入到運算神經(jīng)科學(xué)這個領(lǐng)域中,而且也把運算的技術(shù)帶到了這個領(lǐng)域。
Hinton選擇的另外一條路,他很執(zhí)著,他要讓玻爾磁曼機運行下去,所以他接下來的30年都在不斷地探索,他想到了一個絕妙的注意,就是在沒有監(jiān)督學(xué)習(xí)的情況下,把網(wǎng)絡(luò)一層一層地建立起來。
圖靈獎也恰恰獎勵了一門心思堅持做研究的研究人員,這對于普通人來說是非常難的?;仡櫼幌滤心切┤〉镁薮筮M步的偉大科學(xué)家,包括牛頓,他們都是非常專注地進行研究的學(xué)者。發(fā)現(xiàn)了問題之后不輕易放棄,持續(xù)地一年又一年地去研究這個問題,直到找到問題的答案,這就是Hinton擁有的一個特質(zhì)。
在那30年中,每隔幾年我都會收到他的電話,每次第一句話都是“我想我已經(jīng)搞明白了大腦是怎么工作了”,每一次,他都會告訴我一個絕妙地改進神經(jīng)網(wǎng)絡(luò)模型的新方案。
張宏江:有很多人對深度學(xué)習(xí)有一些批評,您之前就已經(jīng)預(yù)測了2015年會迎來深度學(xué)習(xí)的突破。
但是這么多年當(dāng)中,時至今日,我們依然會有同樣的疑問,我們?nèi)说膶W(xué)習(xí)非常快速,不需要那么多海量的數(shù)據(jù),從少量的例子就可以進行學(xué)習(xí)。
但是今天有了強大的計算能力,深度學(xué)習(xí)網(wǎng)絡(luò)卻依然需要這么多海量數(shù)據(jù),有人在質(zhì)疑,其實機器學(xué)習(xí)并不是真的模仿了人腦?
特倫斯:這是一個非常有趣的領(lǐng)域,目前正在進行大量的研究。監(jiān)督學(xué)習(xí)之所以占主導(dǎo)地位,是因為它非常高效。
但如果與人類的嬰兒做對比的話,你就會發(fā)現(xiàn),嬰兒其實也花了好幾年的時間在不斷地學(xué)習(xí)、體驗,每秒鐘嬰兒的大腦內(nèi)會有近百萬個突觸在同時進行信號的傳遞。這是一個漫長的過程,在這個過程中,其實嬰兒接受的就是大量沒有標(biāo)記的數(shù)據(jù)的訓(xùn)練。
在嬰兒出生的第一年,他們的行為和動作都是非常不協(xié)調(diào)的,這說明一般的對抗網(wǎng)絡(luò)是沒有監(jiān)督、沒有標(biāo)簽的。
但是嬰兒可以進行自我監(jiān)督學(xué)習(xí),對外界世界反復(fù)做出測試并接收反饋來提高神經(jīng)網(wǎng)絡(luò)的性能,也就是強化學(xué)習(xí)。此外,嬰兒還會通過模仿學(xué)習(xí)來獲得技能。對比來說,其實嬰兒接收到的數(shù)據(jù)更多更大。