开心六月综合激情婷婷|欧美精品成人动漫二区|国产中文字幕综合色|亚洲人在线成视频

    1. 
      
        <b id="zqfy3"><legend id="zqfy3"><fieldset id="zqfy3"></fieldset></legend></b>
          <ul id="zqfy3"></ul>
          <blockquote id="zqfy3"><strong id="zqfy3"><dfn id="zqfy3"></dfn></strong></blockquote>
          <blockquote id="zqfy3"><legend id="zqfy3"></legend></blockquote>
          打開(kāi)APP
          userphoto
          未登錄

          開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

          開(kāi)通VIP
          數(shù)據(jù)挖掘

          數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)(knowledge discovery in database)是指將未加工的數(shù)據(jù)轉(zhuǎn)換為有用信息的整個(gè)過(guò)程,此過(guò)程包括一系列轉(zhuǎn)換步驟,從數(shù)據(jù)的預(yù)處理到數(shù)據(jù)挖掘結(jié)果的后處理。數(shù)據(jù)挖掘技術(shù)可以用來(lái)探查大型數(shù)據(jù)庫(kù),發(fā)現(xiàn)先前未知的有用模式。數(shù)據(jù)挖掘還可以預(yù)測(cè)未來(lái)觀測(cè)結(jié)果。

          數(shù)據(jù)挖掘利用了來(lái)自如下領(lǐng)域的思想:①統(tǒng)計(jì)學(xué)的抽樣、估計(jì)和假設(shè)檢驗(yàn)。②人工智能、模式識(shí)別和機(jī)器學(xué)習(xí)的搜索算法、建模技術(shù)和學(xué)習(xí)理論。③最優(yōu)化、進(jìn)化計(jì)算、信息論、信號(hào)處理、可視化和信息檢索等領(lǐng)域的思想。

          通常,數(shù)據(jù)挖掘任務(wù)分為兩大類:①預(yù)測(cè)任務(wù)。這些任務(wù)的目標(biāo)是根據(jù)其他屬性的值,預(yù)測(cè)特定屬性的值。②描述任務(wù)。此任務(wù)的目標(biāo)是導(dǎo)出概括數(shù)據(jù)中潛在聯(lián)系的模式(相關(guān)、趨勢(shì)、聚類、軌跡和異常)。本質(zhì)上,描述性數(shù)據(jù)挖掘任務(wù)通常是探查性的,并且常常需要后處理技術(shù)驗(yàn)證和解釋結(jié)果。其中,預(yù)測(cè)建模涉及以自變量函數(shù)的方式為因變量建立模型。有兩類預(yù)測(cè)建模任務(wù):一個(gè)是分類,用于預(yù)測(cè)離散的因變量;另一個(gè)是回歸,用于預(yù)測(cè)連續(xù)的因變量。

          關(guān)聯(lián)分析、聚類分析和異常檢測(cè)是實(shí)現(xiàn)數(shù)據(jù)挖掘任務(wù)的方法。關(guān)聯(lián)分析用來(lái)發(fā)現(xiàn)描述數(shù)據(jù)中強(qiáng)關(guān)聯(lián)特征的模式。所發(fā)現(xiàn)的模式通常蘊(yùn)含規(guī)則或特征子集的形式表示。由于搜索空間是指數(shù)規(guī)模的,關(guān)聯(lián)分析的目標(biāo)是以有效的方式提取最有趣的模式。聚類分析旨在發(fā)現(xiàn)緊密相關(guān)的觀測(cè)值組群,使得與屬于不同簇的觀測(cè)值相比,屬于同一簇的觀測(cè)值相互之間盡可能類似。異常檢測(cè)的任務(wù)是識(shí)別其特征顯著不同于其他數(shù)據(jù)的觀測(cè)值。這樣的觀測(cè)值稱為異常點(diǎn)或離群點(diǎn)。異常檢測(cè)算法的目標(biāo)是發(fā)現(xiàn)真正的異常點(diǎn),而避免錯(cuò)誤地將正常的對(duì)象標(biāo)注為異常點(diǎn)。

          數(shù)據(jù)挖掘主要算法有決策樹(shù)算法(如C4.5和CART算法)、K均值聚類算法、支持向量機(jī)、Apriori關(guān)聯(lián)算法、EM最大期望算法、連接分析算法(如PageRank算法)、AdaBoost迭代算法、k鄰近算法、樸素貝葉斯算法等。

          本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
          打開(kāi)APP,閱讀全文并永久保存 查看更多類似文章
          猜你喜歡
          類似文章
          part0-數(shù)據(jù)挖掘引文
          數(shù)據(jù)挖覺(jué)
          數(shù)據(jù)挖掘的入門(mén)概念
          學(xué)會(huì)數(shù)據(jù)分析背后的挖掘思維,分析就完成了一半!
          數(shù)據(jù)挖掘任務(wù)類型
          干貨 | 數(shù)據(jù)挖掘中的十大實(shí)用方法
          更多類似文章 >>
          生活服務(wù)
          分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
          綁定賬號(hào)成功
          后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
          如果VIP功能使用有故障,
          可點(diǎn)擊這里聯(lián)系客服!

          聯(lián)系客服