《人工智能之表示學(xué)習(xí)》報(bào)告重磅發(fā)布:在低維空間中高效計(jì)算實(shí)體和關(guān)系的語(yǔ)義聯(lián)系
導(dǎo)讀:近日,由清華大學(xué)人工智能研究院、北京智源人工智能研究院和清華-中國(guó)工程知識(shí)智能聯(lián)合研究中心編寫的《人工智能之表示學(xué)習(xí)》報(bào)告正式發(fā)布。該報(bào)告主要從概念、理論模型、領(lǐng)域人才、技術(shù)趨勢(shì)等4個(gè)部分,介紹知識(shí)表示學(xué)習(xí)的技術(shù)發(fā)展和研究最新進(jìn)展,并展望該技術(shù)的未來(lái)發(fā)展方向與前景。近年來(lái),以深度學(xué)習(xí)為代表的表示學(xué)習(xí)技術(shù)熱度高漲,在語(yǔ)音識(shí)別、圖像分析和自然語(yǔ)言處理領(lǐng)域獲得廣泛關(guān)注。表示學(xué)習(xí)旨在將研究對(duì)象的語(yǔ)義信息表示為稠密低維實(shí)值向量,便于在低維空間中進(jìn)行對(duì)象關(guān)系的語(yǔ)義關(guān)聯(lián)計(jì)算,并有效解決數(shù)據(jù)稀疏問(wèn)題,顯著提升自然語(yǔ)言處理、計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)算法等任務(wù)的性能。本報(bào)告根據(jù)《CCF推薦國(guó)際學(xué)術(shù)期刊和會(huì)議目錄》和ACM計(jì)算機(jī)學(xué)分類系統(tǒng)相關(guān)子領(lǐng)域的A類期刊和會(huì)議作為數(shù)據(jù)來(lái)源,主要研究2010-2020年期間表示學(xué)習(xí)的技術(shù)發(fā)展和最新研究進(jìn)展,并展望該技術(shù)的未來(lái)發(fā)展方向與前景。報(bào)告綜合運(yùn)用了文獻(xiàn)分析、大數(shù)據(jù)分析和挖掘技術(shù)、特征抽取、人才畫像等研究方法。借助科技情報(bào)大數(shù)據(jù)挖掘與服務(wù)系統(tǒng)平臺(tái)AMiner,通過(guò)“表示學(xué)習(xí)”領(lǐng)域的關(guān)鍵詞智能匹配出所有相關(guān)論文。并基于這些論文,進(jìn)行進(jìn)一步挖掘分析。在語(yǔ)音交互的AI時(shí)代,深度學(xué)習(xí)的出現(xiàn)與發(fā)展使自然語(yǔ)言處理(NLP)技術(shù)取得了重大的突破。深度學(xué)習(xí)的重點(diǎn)之一則是語(yǔ)言表示學(xué)習(xí),該報(bào)告主要從表示學(xué)習(xí)的理論基礎(chǔ)、主要方法、最新科研進(jìn)展及代表性論文解讀等方面進(jìn)行相關(guān)核心技術(shù)介紹。表示學(xué)習(xí)的理論基礎(chǔ)
向量空間模型
詞袋模型
主題模型
獨(dú)熱表示與分布式表示
網(wǎng)絡(luò)表示學(xué)習(xí)的主要算法知識(shí)表示學(xué)習(xí)的主要方法模型該報(bào)告還基于AMiner系統(tǒng)的“Topic必讀論文”功能,通過(guò)本領(lǐng)域?qū)<乙约盁嵝膶I(yè)讀者推薦,選取了表示學(xué)習(xí)領(lǐng)域其中代表性的十篇論文進(jìn)行解讀。此外,該報(bào)告還分析了領(lǐng)域相關(guān)的專利情況、國(guó)家自然科學(xué)基金NSFC項(xiàng)目。表示學(xué)習(xí)領(lǐng)域全球?qū)W者分布地圖如下:表示學(xué)習(xí)領(lǐng)域全國(guó)學(xué)者分布地圖如下:依托AMiner平臺(tái),針對(duì)表示學(xué)習(xí)領(lǐng)域,綜合參考h-index指標(biāo)和領(lǐng)域?qū)<彝扑]意見,報(bào)告還篩選了國(guó)外和國(guó)內(nèi)各10位代表性學(xué)者進(jìn)行學(xué)者畫像展示和簡(jiǎn)要介紹?!皩W(xué)者畫像”是AMiner平臺(tái)的核心服務(wù)功能之一,學(xué)者畫像的特色在于提供專家學(xué)者如姓名、單位、地址、聯(lián)系方式、個(gè)人簡(jiǎn)介、教育經(jīng)歷等個(gè)人基本信息。作為一項(xiàng)新興技術(shù),知識(shí)表示學(xué)習(xí)的未來(lái)技術(shù)發(fā)展和應(yīng)用具有巨大潛力。該篇借助領(lǐng)域技術(shù)分析系統(tǒng)(http://trend.aminer.cn),對(duì)所選期刊和會(huì)議中的科技論文情報(bào)進(jìn)行深入挖掘,對(duì)表示學(xué)習(xí)的技術(shù)趨勢(shì)及國(guó)際研究趨勢(shì)等方面進(jìn)行展示和分析。根據(jù)“表示學(xué)習(xí)”領(lǐng)域關(guān)鍵詞,從AMiner數(shù)據(jù)庫(kù)中查找出指定期刊會(huì)議發(fā)表的論文,其中包含論文所在領(lǐng)域的分支術(shù)語(yǔ)和年份,統(tǒng)計(jì)含有這些術(shù)語(yǔ)論文數(shù)量,給出論文數(shù)量排名前10的技術(shù)術(shù)語(yǔ),再統(tǒng)計(jì)這些術(shù)語(yǔ)的起止年份,劃分時(shí)間窗格,生成大數(shù)據(jù)智能的發(fā)展趨勢(shì)圖。根據(jù)AMiner平臺(tái)分析不同國(guó)家在“表示學(xué)習(xí)”領(lǐng)域的研究趨勢(shì),在趨勢(shì)圖中以不同顏色的色帶代表不同的國(guó)家,以其寬度表示該國(guó)家在當(dāng)年的研究熱度,與當(dāng)年該國(guó)論文數(shù)量呈正相關(guān),每一年份中按照其熱度由高到低進(jìn)行排序。AMiner平臺(tái)提供了領(lǐng)域人才分析功能。可視化的展現(xiàn)領(lǐng)域人才的國(guó)家分布、機(jī)構(gòu)分布、h-index分布;
分析了我國(guó)領(lǐng)域?qū)W者的比較優(yōu)勢(shì)以及中外合作情況;
提供了人才查詢、定位、分析、展示一體化應(yīng)用模式。
利用團(tuán)隊(duì)多年的命名排歧技術(shù),建立了較為完善的學(xué)者-論文映射關(guān)系;
提供學(xué)者研究興趣發(fā)展趨勢(shì)分析、學(xué)者合作者關(guān)系網(wǎng)絡(luò)分析等;
同時(shí)支持用戶交互,通過(guò)眾包方式豐富更新專家學(xué)者的相關(guān)信息。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。