是計算機科學(xué)研究領(lǐng)域的一個重要分支。人工智能是眾多學(xué)科的一個交叉學(xué)科,關(guān)于人工智能并沒有一個統(tǒng)一的定義,我們可以理解為人工智能就是利用機器來模仿和執(zhí)行人類大腦的智力行為,開發(fā)一個能夠在人類現(xiàn)實環(huán)境下做出反應(yīng)和行為、不斷學(xué)習(xí)知識、能夠從一個新生兒變得越來越聰明的系統(tǒng)或軟件。人工智能包括眾多的分支領(lǐng)域,比如大家熟悉的機器學(xué)習(xí)、自然語言理解和模式識別等。
屬于人工智能研究與應(yīng)用的一個分支領(lǐng)域。機器學(xué)習(xí)的研究更加偏向理論性,其目的更偏向于是研究一種為了讓計算機不斷從數(shù)據(jù)中學(xué)習(xí)知識,而使機器學(xué)習(xí)得到的結(jié)果不斷接近目標(biāo)函數(shù)的理論。
機器學(xué)習(xí),引用卡內(nèi)基梅隆大學(xué)機器學(xué)習(xí)研究領(lǐng)域的著名教授Tom Mitchell的經(jīng)典定義:
如果一個程序在使用既有的經(jīng)驗E(Experience)來執(zhí)行某類任務(wù)T(Task)的過程中被認(rèn)為是“具備學(xué)習(xí)能力的”,那么它一定要展現(xiàn)出:利用現(xiàn)有的經(jīng)驗E,不斷改善其完成既定任務(wù)T的性能(Performance)的特質(zhì)。
你可以簡單地理解為,機器學(xué)習(xí)為數(shù)據(jù)挖掘提供了理論方法,而數(shù)據(jù)挖掘技術(shù)是機器學(xué)習(xí)技術(shù)的一個實際應(yīng)用。但在這一應(yīng)用中存在一個很重要的問題需要數(shù)據(jù)挖掘?qū)<医鉀Q,因為傳統(tǒng)的機器學(xué)習(xí)算法多是為了處理中小規(guī)模的數(shù)據(jù)而設(shè)計的,但數(shù)據(jù)挖掘面臨的往往是海量的數(shù)據(jù),如果直接使用機器學(xué)習(xí)的算法可能并不一定能得到令人滿意的效果,因此需要數(shù)據(jù)挖掘?qū)<裔槍唧w的問題對機器學(xué)習(xí)算法進(jìn)行改造和優(yōu)化。
其次,在進(jìn)行數(shù)據(jù)挖掘時,如何管理海量的數(shù)據(jù),這就需要用到數(shù)據(jù)庫的數(shù)據(jù)管理技術(shù)。
因此,數(shù)據(jù)挖掘技術(shù)可以簡單看作是運用數(shù)據(jù)庫提供的數(shù)據(jù)管理技術(shù)來獲取數(shù)據(jù),然后再利用改造后的機器學(xué)習(xí)方法對獲取到的數(shù)據(jù)進(jìn)行學(xué)習(xí),學(xué)習(xí)的結(jié)果可以對未來進(jìn)行預(yù)測。
數(shù)據(jù)分析和數(shù)據(jù)挖掘的區(qū)別和聯(lián)系又是什么,深度學(xué)習(xí)又是什么意思?詳情請持續(xù)關(guān)注(下)篇。
文中若有表述錯誤的地方歡迎大家留言批評指正。
參考文獻(xiàn)
《機器學(xué)習(xí)與數(shù)據(jù)挖掘》周志華
《Python機器學(xué)習(xí)及實踐–從零開始通往Kaggle競賽之路》范淼
《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》吳岸城