來源:專知
摘要:本文介紹Arxiv上的《Explanation in Human-AI Systems》,一篇關(guān)于可解釋機(jī)器學(xué)習(xí)的綜述,介紹了可解釋機(jī)器學(xué)習(xí)的多學(xué)科觀點(diǎn)、歷史研究、模型、關(guān)鍵點(diǎn)等。
可解釋AI是現(xiàn)在正火熱的科研和工程問題。Arxiv上一篇《Explanation in Human-AI Systems: A Literature Meta-Review Synopsis of Key Ideas and Publications and Bibliography for Explainable AI》介紹了可解釋機(jī)器學(xué)習(xí)的多學(xué)科觀點(diǎn)、歷史研究、模型、關(guān)鍵點(diǎn)等,PDF大概內(nèi)容組織如下:
目的、范圍和本文組織結(jié)構(gòu)
該主題的重要性
本文的組織結(jié)構(gòu)
多學(xué)科觀點(diǎn)
哲學(xué)
邏輯學(xué)觀點(diǎn)
機(jī)械學(xué)觀點(diǎn)
統(tǒng)計(jì)學(xué)觀點(diǎn)
相對主義者/實(shí)用主義者的觀點(diǎn)
心理學(xué)
可解釋性與心理學(xué)
社會(huì)心理學(xué)
語言心理學(xué)
團(tuán)隊(duì)科學(xué)
其他人類因素、認(rèn)知系統(tǒng)工程和決策輔助
考慮多學(xué)科觀點(diǎn)的總結(jié)
從研究到相關(guān)主題的發(fā)現(xiàn)
以前的綜述
公平、透明、安全、可靠、道德
信任
因果推理和外展推理
事件和概念的因果和機(jī)械推理
類比
理解解釋
理解的失敗和局限性
復(fù)雜系統(tǒng)的理解
反事實(shí)和對比推理
個(gè)體差異與動(dòng)機(jī)
學(xué)習(xí)和概念形成
心智模型
前瞻推理與規(guī)劃
對話式解釋
自解釋
遷移和泛化
關(guān)鍵論文和它們的貢獻(xiàn)
AI系統(tǒng)的可解釋性:歷史研究的觀點(diǎn)
心理理論、假設(shè)和模型
分類學(xué)
解釋性與基礎(chǔ)認(rèn)知過程的關(guān)系
好解釋的特性
可解釋推理的局限和缺點(diǎn)
解釋性推理的個(gè)體差異
解釋的概念模型
心理模型的總結(jié)
可解釋性AI關(guān)鍵概念的概要
解釋的價(jià)值
形式和內(nèi)容
可解釋性
解釋和證明
候選解釋
心智模型
預(yù)期和前瞻
全局和本地解釋
上下文依賴
對比推理
一致
好的和滿意的解釋
糾正的解釋
信任和可靠
自解釋
主動(dòng)探索作為連續(xù)過程
解釋作為協(xié)作和共同適應(yīng)過程
測量和評價(jià)
可解釋性AI系統(tǒng)的評價(jià):人類參與的性能評價(jià)
部分PDF內(nèi)容:
參考鏈接:
https://arxiv.org/pdf/1806.00069.pdf
未來智能實(shí)驗(yàn)室是人工智能學(xué)家與科學(xué)院相關(guān)機(jī)構(gòu)聯(lián)合成立的人工智能,互聯(lián)網(wǎng)和腦科學(xué)交叉研究機(jī)構(gòu)。
未來智能實(shí)驗(yàn)室的主要工作包括:建立AI智能系統(tǒng)智商評測體系,開展世界人工智能智商評測;開展互聯(lián)網(wǎng)(城市)云腦研究計(jì)劃,構(gòu)建互聯(lián)網(wǎng)(城市)云腦技術(shù)和企業(yè)圖譜,為提升企業(yè),行業(yè)與城市的智能水平服務(wù)。