大數(shù)據(jù)管理作為一門學(xué)科,它包含相關(guān)的理論、法律法規(guī)、政策、規(guī)劃、流程、技術(shù)、方法和程序等的研究和建設(shè)。作為一種過(guò)程,它包含數(shù)據(jù)的采集、認(rèn)證、清洗處理、標(biāo)注、分析、組織、存檔、查詢、保護(hù),數(shù)據(jù)產(chǎn)品和服務(wù)的設(shè)計(jì)、開發(fā)、交付以及提高數(shù)據(jù)資產(chǎn)價(jià)值等一系列業(yè)務(wù)職能和活動(dòng)。
大數(shù)據(jù)作為信息資源的一種新類型,是人類大規(guī)模應(yīng)用信息技術(shù)行為(包括各領(lǐng)域各行業(yè)的信息化建設(shè)和人們?nèi)粘?yīng)用)的產(chǎn)物。它主要由科研觀測(cè)大數(shù)據(jù)、互聯(lián)網(wǎng)大數(shù)據(jù)、各行業(yè)信息化建設(shè)形成的大數(shù)據(jù)等構(gòu)成。大數(shù)據(jù)及其管理的概念和思想起源于歐美科學(xué)界的e-Science和Cyber-Infrastructure等大規(guī)模國(guó)際科研合作活動(dòng)和數(shù)據(jù)庫(kù)技術(shù)。1993年4月,在美國(guó)能源部召開的基因組信息學(xué)專題討論會(huì)上首次提出了“data curation”(數(shù)據(jù)管理)問(wèn)題,指出隨著基因組學(xué)數(shù)據(jù)庫(kù)的發(fā)展,產(chǎn)生了新的專業(yè)數(shù)據(jù)庫(kù)管理師崗位,需要開發(fā)管理工具以鼓勵(lì)數(shù)據(jù)創(chuàng)建者持續(xù)承擔(dān)維護(hù)數(shù)據(jù)質(zhì)量的責(zé)任。1998年,美國(guó)SGI公司的首席科學(xué)家J.R.馬西[注]在一個(gè)國(guó)際會(huì)議報(bào)告中首次用“big data”描述一個(gè)新的挑戰(zhàn):隨著數(shù)據(jù)量的快速增長(zhǎng),必將出現(xiàn)數(shù)據(jù)難理解、難獲取、難處理和難組織四個(gè)難題。2001年10月,在倫敦?cái)?shù)字保存聯(lián)盟和英國(guó)國(guó)家空間中心召開的“數(shù)字歸檔、保存與e-Science”研討會(huì)上,與會(huì)者提出了數(shù)字管理[注]的概念(包含數(shù)據(jù)管理和數(shù)字保存)。2002年,微軟公司首席研究員、計(jì)算機(jī)圖靈獎(jiǎng)獲得者J.格雷[注]指出,由于科學(xué)數(shù)據(jù)的短暫性和臨時(shí)性,需要?jiǎng)?chuàng)建數(shù)據(jù)庫(kù)和專門管理機(jī)構(gòu),以保障未來(lái)可以永久使用科學(xué)數(shù)據(jù)。2003年英國(guó)聯(lián)合信息委員會(huì)在一份調(diào)查報(bào)告中分析了e-Science項(xiàng)目中數(shù)據(jù)管理的現(xiàn)狀和未來(lái)需求,并從戰(zhàn)略和政策層面提出若干建議。到2007年,格雷在向美國(guó)國(guó)家科學(xué)基金會(huì)[注]提交基金申請(qǐng)時(shí),提出大數(shù)據(jù)將成為人類觸摸、理解和逼近現(xiàn)實(shí)復(fù)雜系統(tǒng)的有效途徑的論點(diǎn),認(rèn)為科學(xué)研究將迎來(lái)其第四范式——“數(shù)據(jù)探索”范式(后被稱為“數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)”范式),并進(jìn)一步指出數(shù)據(jù)密集型科學(xué)研究的完整生命周期包括數(shù)據(jù)獲取、管理、分析和可視化四個(gè)過(guò)程,其中數(shù)據(jù)管理過(guò)程包含了從制定標(biāo)準(zhǔn)、數(shù)據(jù)轉(zhuǎn)換到元數(shù)據(jù)創(chuàng)建、語(yǔ)義注釋和文獻(xiàn)鏈接等諸多活動(dòng)。2008年,《自然》雜志(第455卷第7209期)推出題為“大數(shù)據(jù)”的封面專欄。
之后,越來(lái)越多的領(lǐng)域開始關(guān)注大數(shù)據(jù)及其管理問(wèn)題。以移動(dòng)互聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)和云計(jì)算等為標(biāo)志的新一代互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用,使數(shù)據(jù)體量呈幾何級(jí)數(shù)的爆炸性增長(zhǎng),大數(shù)據(jù)成為現(xiàn)實(shí)世界的一種寶貴資源和競(jìng)爭(zhēng)武器,而人類的數(shù)據(jù)處理能力與數(shù)據(jù)資源規(guī)模及增長(zhǎng)速度之間的“剪刀差”也迅速拉大。這種現(xiàn)象和趨勢(shì)引起政府、經(jīng)濟(jì)界、媒體界和社會(huì)的廣泛重視。在經(jīng)濟(jì)界,2010年2月,英國(guó)《經(jīng)濟(jì)學(xué)家》[注]雜志發(fā)文:“Data, data everywhere(數(shù)據(jù),無(wú)所不在的數(shù)據(jù))?!?011年5月,麥肯錫全球研究院[注]發(fā)布研究報(bào)告《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力下的一個(gè)新領(lǐng)域》[注],指出大數(shù)據(jù)已經(jīng)開始滲透到每一個(gè)社會(huì)領(lǐng)域,成為重要的生產(chǎn)要素。2012年1月,達(dá)沃斯世界經(jīng)濟(jì)論壇發(fā)布報(bào)告《大數(shù)據(jù),大影響》[注],稱數(shù)據(jù)已經(jīng)成為一種新的經(jīng)濟(jì)資產(chǎn)類別,就像貨幣和黃金一樣,是21世紀(jì)的石油。2014年3月,貴州·北京大數(shù)據(jù)產(chǎn)業(yè)發(fā)展推介會(huì)在北京舉行,中國(guó)貴州大數(shù)據(jù)經(jīng)濟(jì)正式起航。
在媒體界,許多報(bào)紙雜志發(fā)表大量有關(guān)大數(shù)據(jù)的文章。2012年有兩部書備受關(guān)注,一部是牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)治理與監(jiān)管專業(yè)教授V.邁爾-舍恩伯格同他人合著的《大數(shù)據(jù)時(shí)代:改變我們的生活、工作和思考方式的一場(chǎng)革命》[注],書中聲稱:大數(shù)據(jù)將使研究范式從傳統(tǒng)的隨機(jī)采樣、強(qiáng)調(diào)因果和精確求解范式轉(zhuǎn)變?yōu)槿w數(shù)據(jù)、只看相關(guān)和近似求解的新范式,并預(yù)言大數(shù)據(jù)將導(dǎo)致人類思維、商業(yè)以及管理領(lǐng)域的變革;另一部是中國(guó)信息管理專家、科技作家涂子沛著的《大數(shù)據(jù)》。二者用通俗的語(yǔ)言和多樣的案例為大數(shù)據(jù)時(shí)代的到來(lái)做了非常有效的科普宣傳,使社會(huì)大眾對(duì)大數(shù)據(jù)的關(guān)注度進(jìn)入高潮。2013年被稱為中國(guó)大數(shù)據(jù)時(shí)代元年。
隨著大數(shù)據(jù)在醫(yī)療健康、疫情防控、應(yīng)急管理、網(wǎng)絡(luò)安全、工業(yè)制造、農(nóng)業(yè)生產(chǎn)、經(jīng)濟(jì)金融、交通運(yùn)輸、教育科研和社區(qū)管理等領(lǐng)域的廣泛應(yīng)用,人類在喜迎新的發(fā)展機(jī)遇的同時(shí),也面臨著巨大的挑戰(zhàn)。一些國(guó)家的政府和政治家注意到:國(guó)家間對(duì)數(shù)據(jù)資源的爭(zhēng)奪日益激烈,給國(guó)家安全和經(jīng)濟(jì)發(fā)展帶來(lái)很大影響;少數(shù)數(shù)據(jù)寡頭憑借數(shù)據(jù)資源優(yōu)勢(shì)試圖操縱市場(chǎng)和滲透到政治等敏感領(lǐng)域,并容易造成社會(huì)結(jié)構(gòu)失衡,使中小企業(yè)被邊緣化,公眾的個(gè)人空間和權(quán)利受到壓制和損害,進(jìn)而改變社會(huì)意識(shí)和社會(huì)心理,造成社會(huì)失序,加大社會(huì)治理難度和社會(huì)保障的壓力。為此,國(guó)際社會(huì)和許多國(guó)家的政府及社會(huì)各界都紛紛行動(dòng)起來(lái),研究對(duì)策,采取各種行動(dòng),應(yīng)對(duì)挑戰(zhàn)。2012年,聯(lián)合國(guó)發(fā)布大數(shù)據(jù)政務(wù)白皮書《大數(shù)據(jù)促發(fā)展:挑戰(zhàn)與機(jī)遇》[注]。同年3月,美國(guó)政府發(fā)布《大數(shù)據(jù)研究與發(fā)展倡議》[注],認(rèn)為大數(shù)據(jù)的重要性堪比當(dāng)年的信息高速公路。接著,美國(guó)6個(gè)政府部門撥款2億美元,要使美國(guó)的數(shù)據(jù)分析能力提高100倍,以實(shí)現(xiàn)從各種語(yǔ)言的文本中抽取信息。2014年5月,美國(guó)總統(tǒng)行政辦公室發(fā)布研究報(bào)告《大數(shù)據(jù):抓住機(jī)遇,保護(hù)價(jià)值》[注], Preserving Values。2015年8月,中國(guó)國(guó)務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》;同年10月,中國(guó)共產(chǎn)黨第十八屆中央委員會(huì)第五次全體會(huì)議將大數(shù)據(jù)納入中國(guó)國(guó)家發(fā)展戰(zhàn)略。大數(shù)據(jù)管理也隨之成為政府管理和人才培養(yǎng)的新課題,得到有關(guān)方面的高度重視。2014年2月,廣東省率先成立廣東省大數(shù)據(jù)管理局(后更名廣東省政務(wù)服務(wù)數(shù)據(jù)管理局),其職責(zé)是制訂并組織實(shí)施大數(shù)據(jù)戰(zhàn)略、規(guī)劃和政策措施,引導(dǎo)和推動(dòng)大數(shù)據(jù)研究和應(yīng)用等。2015年,浙江省、貴州省也先后設(shè)立大數(shù)據(jù)管理機(jī)構(gòu)。同年,美國(guó)加州大學(xué)伯克利分校[注]在其網(wǎng)課平臺(tái)edx上開設(shè)了“數(shù)據(jù)科學(xué)基礎(chǔ)[注]”課程;兩年后又成立了新的數(shù)據(jù)科學(xué)和信息部,開設(shè)了“數(shù)據(jù)科學(xué)導(dǎo)論[注]”,出現(xiàn)了千人同上數(shù)據(jù)科學(xué)課的火爆場(chǎng)面。2016年,中國(guó)有3所大學(xué)(北京大學(xué)、中南大學(xué)、電子科技大學(xué))獲準(zhǔn)開設(shè)“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)”。2018年,中國(guó)教育部管理科學(xué)與工程類專業(yè)教學(xué)指導(dǎo)委員會(huì)“新專業(yè)建設(shè)研究”課題組向教育部有關(guān)部門提出設(shè)立大數(shù)據(jù)相關(guān)專業(yè)的建議,得到批準(zhǔn)并定名為“大數(shù)據(jù)管理與應(yīng)用專業(yè)”。標(biāo)志著大數(shù)據(jù)管理開始作為一個(gè)學(xué)科和實(shí)踐領(lǐng)域矗立在世人面前。
大數(shù)據(jù)管理和應(yīng)用的發(fā)展階段,國(guó)家和政府層面主要經(jīng)歷了或正在經(jīng)歷戰(zhàn)略布局、政策制定和立法、數(shù)據(jù)開放、公眾服務(wù)、產(chǎn)業(yè)發(fā)展和社會(huì)協(xié)同治理等階段。組織和企業(yè)層面經(jīng)歷了嘗試期(開始認(rèn)識(shí)到數(shù)據(jù)是寶貴資源和核心競(jìng)爭(zhēng)力,實(shí)踐上尚處于分散管理和各自為政狀態(tài)),正在走向成型期(數(shù)據(jù)資源積累越來(lái)越多,開始建立數(shù)據(jù)中心或類似組織,企業(yè)級(jí)的數(shù)據(jù)戰(zhàn)略和分析應(yīng)用開始成型)。2020年以來(lái),大數(shù)據(jù)應(yīng)用正在向各個(gè)領(lǐng)域拓展和深入。行業(yè)流程和知識(shí)與大數(shù)據(jù)資源相結(jié)合,通過(guò)建模和算法設(shè)計(jì),努力實(shí)現(xiàn)動(dòng)態(tài)感知、敏捷分析、全局優(yōu)化和智能決策能力,給相關(guān)行業(yè)的信息系統(tǒng)增加了智能。相應(yīng)地,這些行業(yè)也在加強(qiáng)數(shù)據(jù)管理意識(shí),加快數(shù)據(jù)管理能力的建設(shè)。越來(lái)越多的政府機(jī)構(gòu)、企業(yè)和研發(fā)機(jī)構(gòu)開始重視數(shù)據(jù)戰(zhàn)略設(shè)計(jì),并使之與組織的業(yè)務(wù)發(fā)展戰(zhàn)略相結(jié)合,設(shè)立數(shù)據(jù)管理的專職機(jī)構(gòu)或崗位,啟動(dòng)數(shù)據(jù)治理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)安全等業(yè)務(wù)。
大數(shù)據(jù)管理作為一個(gè)新興學(xué)科,它繼承和借鑒了信息管理、數(shù)據(jù)管理[注]和數(shù)據(jù)科學(xué)[注]等領(lǐng)域的理論方法知識(shí)和實(shí)踐手段。其研究?jī)?nèi)容正在發(fā)展和探索中。其主要研究領(lǐng)域和內(nèi)容可以歸納為7個(gè)方面:①大數(shù)據(jù)理論研究。包括大數(shù)據(jù)管理相關(guān)理論方法研究,如大數(shù)據(jù)的特征、結(jié)構(gòu)、類型、屬性、功能、價(jià)值等研究。更深層次的需要探索的問(wèn)題也有很多,如數(shù)據(jù)的本質(zhì)是什么;數(shù)據(jù)世界的結(jié)構(gòu)是什么樣的,它具有什么特征和規(guī)律性;數(shù)據(jù)世界與自然界和人類社會(huì)之間是什么關(guān)系等。②相關(guān)發(fā)展戰(zhàn)略和政策規(guī)劃研究。包括研究國(guó)家與政府的大數(shù)據(jù)戰(zhàn)略、規(guī)劃與政策,以及大數(shù)據(jù)跨境流通的相關(guān)政策、規(guī)劃等。③大數(shù)據(jù)社會(huì)治理研究。包括研究大數(shù)據(jù)管理涉及的法律(如大數(shù)據(jù)安全法、數(shù)據(jù)隱私保護(hù)法等)、制度與體制(如建立和健全治理體系和各級(jí)管理體制及各種規(guī)章制度)的研究,數(shù)據(jù)公開和跨境流通的法律規(guī)范和制度約束以及數(shù)據(jù)主權(quán)等國(guó)際規(guī)則問(wèn)題的研究。④技術(shù)方法與標(biāo)準(zhǔn)規(guī)范研究。包括大數(shù)據(jù)的采集技術(shù)、預(yù)處理技術(shù)(數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約和數(shù)據(jù)轉(zhuǎn)換)、數(shù)據(jù)溯源、標(biāo)注技術(shù)、存儲(chǔ)技術(shù)(分布式存儲(chǔ)、NoSQL數(shù)據(jù)庫(kù)和云存儲(chǔ))、分析技術(shù)(離線分析、實(shí)時(shí)交互式分析、概要構(gòu)建和智能分析等)、檢索技術(shù)、可視化技術(shù)以及相關(guān)標(biāo)準(zhǔn)規(guī)范的研究。⑤大數(shù)據(jù)經(jīng)濟(jì)研究。包括研究大數(shù)據(jù)開發(fā)利用與大數(shù)據(jù)產(chǎn)業(yè)。大數(shù)據(jù)的價(jià)值屬性和產(chǎn)權(quán)屬性需要通過(guò)管理和應(yīng)用來(lái)實(shí)現(xiàn)。大數(shù)據(jù)成為資產(chǎn)的兩個(gè)基本前提條件是能夠確權(quán)和定價(jià)。數(shù)據(jù)中心的建設(shè)和布局優(yōu)化問(wèn)題,數(shù)據(jù)資產(chǎn)經(jīng)營(yíng),數(shù)據(jù)產(chǎn)品開發(fā)和營(yíng)銷,數(shù)據(jù)市場(chǎng)管理,大數(shù)據(jù)應(yīng)用如何更好地與實(shí)體經(jīng)濟(jì)融合等都是急需研究和解決的問(wèn)題。⑥“數(shù)字人文[注]”研究。包括古籍?dāng)?shù)字化、語(yǔ)言文字與文學(xué)語(yǔ)料庫(kù)、歷史信息學(xué)、歷史地理信息系統(tǒng)、數(shù)字化考古、古代學(xué)術(shù)傳承可視化、民族文化演進(jìn)與傳播、民族文化交流融合過(guò)程、社會(huì)記憶和國(guó)家記憶、宗教教義文本分析以及相關(guān)的研究平臺(tái)、資源、研究范式和工具等。⑦組織機(jī)構(gòu)層面的大數(shù)據(jù)管理研究。2018年頒布的中國(guó)國(guó)家標(biāo)準(zhǔn)《數(shù)據(jù)管理能力成熟度評(píng)估模型》(GB/T 36073—2018)借鑒國(guó)際經(jīng)驗(yàn),將企事業(yè)單位的數(shù)據(jù)管理職能歸納為8個(gè)領(lǐng)域29個(gè)細(xì)項(xiàng)。這8個(gè)領(lǐng)域是:數(shù)據(jù)戰(zhàn)略管理(含戰(zhàn)略規(guī)劃、實(shí)施和評(píng)估)、數(shù)據(jù)治理(含組織建設(shè)、制度建設(shè)和溝通)、數(shù)據(jù)架構(gòu)(含數(shù)據(jù)建模、集成與共享、元數(shù)據(jù)管理等)、數(shù)據(jù)應(yīng)用(含數(shù)據(jù)分析、開放共享和服務(wù))、數(shù)據(jù)安全管理(含安全策略、實(shí)施和安全審計(jì))、數(shù)據(jù)質(zhì)量管理(含質(zhì)量指標(biāo)和質(zhì)量檢查、分析及提升)、數(shù)據(jù)標(biāo)準(zhǔn)(含制定或采用業(yè)務(wù)數(shù)據(jù)、參考數(shù)據(jù)和主數(shù)據(jù)、數(shù)據(jù)元、指標(biāo)數(shù)據(jù)等標(biāo)準(zhǔn))、數(shù)據(jù)生命周期管理(含從數(shù)據(jù)需求提出到數(shù)據(jù)設(shè)計(jì)和開放、數(shù)據(jù)運(yùn)維,直至數(shù)據(jù)退役的整個(gè)生命周期的管理)。該標(biāo)準(zhǔn)規(guī)定了中國(guó)組織機(jī)構(gòu)層次的數(shù)據(jù)管理的基本內(nèi)容,也適用于組織機(jī)構(gòu)層次的大數(shù)據(jù)管理及研究工作。
大數(shù)據(jù)管理與信息管理、情報(bào)學(xué)和數(shù)據(jù)科學(xué)有著密切關(guān)系。它們?cè)谘芯繉?duì)象上有不同程度的交叉重疊,都包含數(shù)據(jù)、信息及相關(guān)資源和活動(dòng),但是側(cè)重點(diǎn)有所不同。信息管理涵蓋面更寬,包含了政府信息資源管理、企業(yè)信息資源管理、大數(shù)據(jù)管理以及文獻(xiàn)管理、內(nèi)容管理、知識(shí)管理、信息技術(shù)管理、信息系統(tǒng)管理等分支領(lǐng)域。情報(bào)學(xué)主要研究信息的收集、分析處理、組織、存儲(chǔ)、檢索、利用和服務(wù)的理論方法、技術(shù)及相關(guān)的政策法律、經(jīng)濟(jì)、管理和文化問(wèn)題。數(shù)據(jù)科學(xué)起源于e-Science領(lǐng)域的數(shù)據(jù)管理[注]和數(shù)據(jù)庫(kù)技術(shù),更多地關(guān)注數(shù)據(jù)采集與集成、數(shù)據(jù)挖掘、數(shù)據(jù)分析推理、數(shù)據(jù)探索、數(shù)據(jù)實(shí)驗(yàn)、數(shù)據(jù)可視化和數(shù)據(jù)安全等問(wèn)題。在管理哲學(xué)和理論上,它們的共同點(diǎn)都把其管理對(duì)象視為資源或重要資源,把信息科學(xué)視為學(xué)科的基礎(chǔ)理論之一。不同點(diǎn)方面,信息管理、情報(bào)學(xué)和大數(shù)據(jù)管理強(qiáng)調(diào)管理科學(xué)、系統(tǒng)科學(xué)理論和經(jīng)濟(jì)學(xué)理論(如信息經(jīng)濟(jì)學(xué)中的信息不對(duì)稱理論等),數(shù)據(jù)科學(xué)似乎更強(qiáng)調(diào)數(shù)理科學(xué)領(lǐng)域的理論。在研究范式上,大數(shù)據(jù)管理和數(shù)據(jù)科學(xué)更多地運(yùn)用所謂的“第四范式”,即數(shù)據(jù)范式,而信息管理和情報(bào)學(xué)更多地采用信息分析范式、信息計(jì)量范式和實(shí)驗(yàn)研究(如信息檢索模型和檢索系統(tǒng)評(píng)價(jià)試驗(yàn)等)。在手段和工具上,它們的共同點(diǎn)也有很多,除了傳統(tǒng)和通用的,計(jì)算機(jī)、網(wǎng)絡(luò)設(shè)施、算法、數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘及其他各種各樣的信息處理和分析軟件工具等,都有不同程度的應(yīng)用。僅以大數(shù)據(jù)管理與數(shù)據(jù)科學(xué)來(lái)比較的話,大數(shù)據(jù)管理更強(qiáng)調(diào)大數(shù)據(jù)的管理和領(lǐng)域應(yīng)用,數(shù)據(jù)科學(xué)則強(qiáng)調(diào)大數(shù)據(jù)的學(xué)理和技術(shù)實(shí)現(xiàn)。大數(shù)據(jù)管理也是信息管理學(xué)科在現(xiàn)階段的主要內(nèi)容和未來(lái)發(fā)展趨勢(shì)。它將吸收和借鑒上述相關(guān)學(xué)科的理論方法,加以融合和創(chuàng)新,逐步形成有時(shí)代特色,符合社會(huì)需要和學(xué)科發(fā)展規(guī)律的學(xué)科理論方法體系。
大數(shù)據(jù)正在影響和改變社會(huì),改變?nèi)藗兊纳?、工作和思考方式。大?shù)據(jù)已經(jīng)通過(guò)一個(gè)個(gè)的APP(應(yīng)用程序)和便攜式終端悄然走進(jìn)廣大老百姓的生活。大數(shù)據(jù)中隱藏大量的個(gè)人隱私以及錯(cuò)誤、偏見和邪惡,容易產(chǎn)生誤導(dǎo)、曲解和隱私泄露,影響社會(huì)心理和社會(huì)意識(shí),也容易被人利用成為歧視或傷害他人的手段。
大數(shù)據(jù)管理可以為政府匯集數(shù)據(jù)提供一個(gè)管理平臺(tái),利用大數(shù)據(jù)來(lái)了解社會(huì)的運(yùn)行機(jī)理和人類的行為模式,以服務(wù)于政府決策、社會(huì)管理和績(jī)效考核,優(yōu)化營(yíng)商環(huán)境,防控安全風(fēng)險(xiǎn),在維護(hù)社會(huì)穩(wěn)定等方面發(fā)揮重要作用。大數(shù)據(jù)管理也正在成為國(guó)際政治的一個(gè)角力場(chǎng),國(guó)家間的數(shù)據(jù)資源及其控制權(quán)的爭(zhēng)奪將日趨激烈。
運(yùn)用大數(shù)據(jù)和新一代信息技術(shù)推動(dòng)經(jīng)濟(jì)發(fā)展、完善社會(huì)治理、提升政府服務(wù)和監(jiān)管能力正成為世界性趨勢(shì)。大數(shù)據(jù)對(duì)全球生產(chǎn)、流通、分配、消費(fèi)活動(dòng)以及經(jīng)濟(jì)運(yùn)行機(jī)制的影響正在顯現(xiàn)。數(shù)字經(jīng)濟(jì)快速發(fā)展,它以海量數(shù)據(jù)為重要生產(chǎn)要素,利用新一代信息技術(shù),形成新的生產(chǎn)力和新動(dòng)能,實(shí)現(xiàn)數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化,打通不同行業(yè)、不同層級(jí)的數(shù)據(jù)壁壘,創(chuàng)新商業(yè)模式和經(jīng)濟(jì)管理方式,提升各行業(yè)的整體運(yùn)行效率,打造新的數(shù)字經(jīng)濟(jì)體系。面向大數(shù)據(jù)應(yīng)用的新技術(shù)、新產(chǎn)品、新服務(wù)、新業(yè)態(tài)會(huì)不斷涌現(xiàn)。
大數(shù)據(jù)開發(fā)應(yīng)用的飛速發(fā)展,社會(huì)對(duì)大數(shù)據(jù)管理與應(yīng)用人才的需求激增,為本學(xué)科教育的發(fā)展提供了難得的環(huán)境條件,使之得到快速、超常的發(fā)展。中國(guó)高等學(xué)校設(shè)立的與大數(shù)據(jù)相關(guān)專業(yè)主要有3個(gè):數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)、大數(shù)據(jù)管理與應(yīng)用專業(yè)、大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè)。截至2019年,全國(guó)已有82所高校獲準(zhǔn)設(shè)立大數(shù)據(jù)管理與應(yīng)用本科專業(yè),有481所高校獲準(zhǔn)設(shè)立數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè),有1355所職業(yè)院校獲準(zhǔn)設(shè)立大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè)。研究生層次的學(xué)位授權(quán)點(diǎn)和培養(yǎng)方向的設(shè)置也在增多。在美國(guó),很多大學(xué)都先后設(shè)立了數(shù)據(jù)科學(xué)專業(yè),如斯坦福大學(xué)、哈佛大學(xué)、哥倫比亞大學(xué)、加州大學(xué)伯克利分校、卡內(nèi)基-梅隆大學(xué)、康奈爾大學(xué)、紐約大學(xué)、西北大學(xué)等,通常都設(shè)在研究生層次。在課程設(shè)置和培養(yǎng)方式上,微軟公司提出了一個(gè)數(shù)據(jù)科學(xué)知識(shí)體系,劃分為基礎(chǔ)知識(shí)、核心數(shù)據(jù)科學(xué)、數(shù)據(jù)科學(xué)應(yīng)用、項(xiàng)目實(shí)訓(xùn)4個(gè)模塊,從理論到實(shí)戰(zhàn)循序漸進(jìn)。
培養(yǎng)的專業(yè)人才類型更加多樣化,如首席數(shù)據(jù)官(CDO)、數(shù)據(jù)治理專家、數(shù)據(jù)架構(gòu)師、數(shù)據(jù)管理師、數(shù)據(jù)工程師、數(shù)據(jù)分析師、數(shù)據(jù)科學(xué)家等。其中,首席數(shù)據(jù)官是組織機(jī)構(gòu)中負(fù)責(zé)數(shù)據(jù)管理和使用的高級(jí)主管,也是數(shù)據(jù)管理的領(lǐng)軍角色和核心人才,需要了解組織的業(yè)務(wù)戰(zhàn)略和發(fā)展方向,重點(diǎn)致力于利用數(shù)據(jù)資源來(lái)支持組織實(shí)現(xiàn)其目標(biāo)。信息管理學(xué)科、管理科學(xué)與工程學(xué)科、系統(tǒng)工程和軟件工程等學(xué)科是培養(yǎng)大數(shù)據(jù)管理和應(yīng)用人才的主要學(xué)科。大數(shù)據(jù)管理和應(yīng)用專業(yè)正在積極地借鑒和吸收兄弟學(xué)科及相關(guān)學(xué)科的知識(shí)體系和教育經(jīng)驗(yàn),在與這些學(xué)科繼續(xù)合作和協(xié)調(diào)的過(guò)程中加緊建設(shè)好自身的知識(shí)體系和有效的培養(yǎng)模式。
大數(shù)據(jù)管理作為一門學(xué)科還處在發(fā)展初期,不同觀點(diǎn)和學(xué)派并存,專門的理論、方法和技術(shù)還在發(fā)展之中,技術(shù)導(dǎo)向與管理導(dǎo)向之爭(zhēng)將持續(xù)較長(zhǎng)一段時(shí)間。
管理方面需要解決的問(wèn)題有:驅(qū)動(dòng)力問(wèn)題,管理流程和制度問(wèn)題,相關(guān)政策的支持問(wèn)題,相關(guān)職位和崗位的合理設(shè)置問(wèn)題,所需支持性服務(wù)(數(shù)據(jù)測(cè)評(píng)服務(wù)、流程優(yōu)化咨詢、績(jī)效評(píng)價(jià)、培訓(xùn)等)供應(yīng)不足的問(wèn)題等。大數(shù)據(jù)治理體系尚未建立,數(shù)據(jù)安全、隱私保護(hù)、數(shù)據(jù)所有權(quán)問(wèn)題以及與數(shù)據(jù)共享利用之間的尖銳矛盾,依然存在。
技術(shù)方面面臨著嚴(yán)峻挑戰(zhàn),大數(shù)據(jù)管理和應(yīng)用要求人們?cè)诔龅湫蛿?shù)據(jù)管理系統(tǒng)處理能力的、數(shù)據(jù)間存在直接或間接關(guān)聯(lián)性的、多源異構(gòu)的超大規(guī)模數(shù)據(jù)集合中,分析挖掘出有用的模式和知識(shí),故需要解決很多技術(shù)難題。例如:現(xiàn)有的主流數(shù)據(jù)庫(kù)技術(shù)對(duì)大體量數(shù)據(jù)進(jìn)行操作可能會(huì)造成系統(tǒng)性能顯著下降;非關(guān)系型數(shù)據(jù)庫(kù)將成為研究熱點(diǎn)和難點(diǎn);數(shù)據(jù)連接、聚類、統(tǒng)計(jì)、排序等操作需要先進(jìn)的并行操作算法來(lái)實(shí)現(xiàn);并行操作的查詢優(yōu)化問(wèn)題等。另外,技術(shù)運(yùn)維方面也面臨著能源與冷卻、部署靈活性、可擴(kuò)展性的優(yōu)化等難題。
應(yīng)用方面也面臨著很多問(wèn)題和挑戰(zhàn)。雖然在人機(jī)博弈等非關(guān)鍵領(lǐng)域取得了較好的效果,但要在政府決策、軍事指揮、醫(yī)療健康、自動(dòng)駕駛等事關(guān)國(guó)家和人類生命財(cái)產(chǎn)安全的關(guān)鍵領(lǐng)域獲得真正有效和可靠的應(yīng)用,仍有許多集成理論和核心技術(shù)問(wèn)題有待解決。雖然新的研究范式——基于數(shù)據(jù)的科學(xué)在科技領(lǐng)域應(yīng)用效果比較明顯,但應(yīng)用在社會(huì)和人類行為的認(rèn)識(shí)方面,仍然是弱項(xiàng)。需要多學(xué)科的研究人員加強(qiáng)合作,利用跨學(xué)科跨領(lǐng)域的專業(yè)知識(shí)和手段,以便能夠更好地發(fā)現(xiàn)缺陷,更深刻地認(rèn)識(shí)社會(huì)結(jié)構(gòu)、社會(huì)運(yùn)動(dòng)和人的行為方式及影響因素,避免偏見和成見。
聯(lián)系客服