唐旭 李林 編譯整理
量子位 出品 | 公眾號(hào) QbitAI
最近,DeepMind在Arxiv上發(fā)布了Interpreting Deep Neural Networks using Cognitive Psychology,將認(rèn)知心理學(xué)的方法引入深度神經(jīng)網(wǎng)絡(luò)的研究。
這是DeepMind入選今年ICML(機(jī)器學(xué)習(xí)國(guó)際會(huì)議)的論文之一。在公開(kāi)論文的同時(shí),他們還在官方博客上對(duì)這篇論文做了介紹。
為什么要用認(rèn)知心理學(xué)方法來(lái)研究深度神經(jīng)網(wǎng)絡(luò)呢?
我們經(jīng)常在新聞中看到,深度神經(jīng)網(wǎng)絡(luò)的能力不斷提升,在圖像識(shí)別、語(yǔ)音識(shí)別以及玩各種游戲的能力上,一一超越了人類。
不過(guò),隨之而來(lái)的也是越來(lái)越復(fù)雜的架構(gòu),和越來(lái)越看不懂的決策過(guò)程。
也就是所謂的“黑箱”問(wèn)題。
現(xiàn)在,每次提到深度學(xué)習(xí),“黑箱”這個(gè)詞似乎如影隨形。DeepMind的論文中說(shuō),“這種不透明性不僅阻礙了嘗試提升這些模型的基礎(chǔ)性研究,也影響了它們?cè)趯?shí)際場(chǎng)景中的落地?!?/p>
怎么打開(kāi)這個(gè)黑箱,成了研究界關(guān)注的一大問(wèn)題。很多團(tuán)隊(duì)想開(kāi)發(fā)“可解釋的人工智能”,讓AI解釋自己的行為。但是,Google工程總監(jiān)、AI經(jīng)典教材《人工智能:一種現(xiàn)代的方法》的第二作者Peter Norvig說(shuō),這根本就行不通:
人類都不擅長(zhǎng)不了自己,就別指望機(jī)器了。
DeepMind這篇論文,正是把研究人類心智這個(gè)大黑箱的方法,用到了深度神經(jīng)網(wǎng)絡(luò)上:通過(guò)測(cè)量神經(jīng)網(wǎng)絡(luò)的行為來(lái)推斷內(nèi)在的認(rèn)知機(jī)制。
他們借用了一個(gè)用以說(shuō)明人類認(rèn)知過(guò)程的實(shí)驗(yàn),來(lái)理解深度神經(jīng)網(wǎng)絡(luò)怎樣解決圖像分類任務(wù)。
DeepMind這篇論文,借用了發(fā)展心理學(xué)中研究?jī)和绾螌W(xué)習(xí)物體和詞對(duì)應(yīng)關(guān)系的方法,來(lái)分析深度神經(jīng)網(wǎng)絡(luò)。
認(rèn)知心理學(xué)研究表明,人類兒童在將物體和詞對(duì)應(yīng)起來(lái)的過(guò)程中,存在三種偏好:
整體偏好:當(dāng)你指著一個(gè)物體,說(shuō)出一個(gè)詞,孩子會(huì)假設(shè)這個(gè)詞指的的整個(gè)物體,而非部件;
分類偏好:孩子會(huì)假設(shè)一個(gè)詞指的是物體所屬的基本類別;
形狀偏好:孩子會(huì)假設(shè)一個(gè)名詞的意思是基于物體的形狀,而不是它的顏色或質(zhì)地。
DeepMind借用的,是研究形狀偏好的認(rèn)知實(shí)驗(yàn),因?yàn)檎J(rèn)知心理學(xué)在這方面的研究最為豐富。
DeepMind測(cè)量深度神經(jīng)網(wǎng)絡(luò)的形狀偏好所用的刺激物樣本,由印第安納大學(xué)認(rèn)知發(fā)展實(shí)驗(yàn)室提供
DeepMind所用的經(jīng)典形狀偏好實(shí)驗(yàn)過(guò)程如下:
1. 給深度神經(jīng)網(wǎng)絡(luò)看三個(gè)物體的圖片:1)基本調(diào)查物體、2)形狀匹配但顏色不匹配的物體、3)顏色匹配但形狀不匹配的物體。
2. 比較神經(jīng)網(wǎng)絡(luò)在分配標(biāo)簽時(shí),為物體1和2分配相同標(biāo)簽的次數(shù),和為物體1和3分配相同標(biāo)簽的次數(shù)所占比例如何。
實(shí)驗(yàn)示意圖
DeepMind的實(shí)驗(yàn)表明,深度神經(jīng)網(wǎng)絡(luò)和人類一樣,具有“形狀偏好”。
深度神經(jīng)網(wǎng)絡(luò)(DNN)在眾多領(lǐng)域的復(fù)雜任務(wù)上都有著卓越的表現(xiàn),它迅速地刷新著我們對(duì)于這些問(wèn)題的認(rèn)知。
過(guò)往的工作只著眼于推進(jìn)我們對(duì)于這些模型的理解,但對(duì)于認(rèn)知心理學(xué)家在這些問(wèn)題上已有的描述、理論和實(shí)驗(yàn)方法,卻沒(méi)有加以充分利用。
為了發(fā)掘這些工具的潛在價(jià)值,我們選擇了在發(fā)展心理學(xué)中一種用來(lái)“解釋兒童如何學(xué)習(xí)物體和詞對(duì)應(yīng)關(guān)系”的固定分析方法,并將其應(yīng)用到DNN上。
用和原有認(rèn)知心理學(xué)實(shí)驗(yàn)類似的刺激物數(shù)據(jù)集進(jìn)行測(cè)試,我們發(fā)現(xiàn),那些在ImageNet上訓(xùn)練的、最好的單個(gè)樣本學(xué)習(xí)(one shot learning)模型表現(xiàn)出了一種與在人類身上觀察到的相似的偏好:它們更喜歡根據(jù)形狀來(lái)對(duì)物體進(jìn)行分類,而不是顏色。
在這種偏好的程度在架構(gòu)相同但seed不同的模型上,會(huì)有非常大的差異,甚至?xí)谟?xùn)練過(guò)程中隨著seed而波動(dòng),盡管它們最終在分類上的表現(xiàn)近乎相同。
這些結(jié)果證明了認(rèn)知心理學(xué)工具在發(fā)掘DNN隱含計(jì)算屬性上的能力,同時(shí)也為我們提供了一種用于人類字詞學(xué)習(xí)的計(jì)算模型。
論文地址:
https://arxiv.org/pdf/1706.08606.pdf
博客文章:
https://deepmind.com/blog/cognitive-psychology/
【完】
一則通知
量子位正在組建自動(dòng)駕駛技術(shù)群,面向研究自動(dòng)駕駛相關(guān)領(lǐng)域的在校學(xué)生或一線工程師。李開(kāi)復(fù)、王詠剛、王乃巖、王弢等大牛都在群里。歡迎大家加量子位微信(qbitbot),備注“自動(dòng)駕駛”申請(qǐng)加入哈~
聯(lián)系客服