上一節(jié)課程中,我們學(xué)習(xí)到了 物聯(lián)網(wǎng) 相關(guān)的知識以及看到了很多已經(jīng)出現(xiàn)在我們生活中的 物聯(lián)網(wǎng) 應(yīng)用。而今天的內(nèi)容呢,其實也和我們的生活有非常緊密的關(guān)系。頭條為什么能一直推薦你喜歡的新聞?網(wǎng)易云音樂為什么讓很多人奉為神器?抖音為什么會讓你刷得停不下來?這些都是大數(shù)據(jù)和 AI 算法在背后做著各種推薦計算。如果說這些 APP 有一些商業(yè)成分存在,想要榨干我們的精力的話,那么智能信號燈、智能交通調(diào)度、國家天網(wǎng)系統(tǒng)、防疫二維碼、大數(shù)據(jù)征信風(fēng)控等等,則是大數(shù)據(jù)和 AI 在社會建設(shè)方面的優(yōu)秀案例??傊?,就像 互聯(lián)網(wǎng)+ 已經(jīng)滲透各行各業(yè)一樣,大數(shù)據(jù)和 AI 也已經(jīng)在各行各業(yè)中遍地開花。
大數(shù)據(jù),從名字就能看出來,肯定數(shù)據(jù)量很大咯?這只是一方面。大數(shù)據(jù)(big data)是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)有 5 個特點(5V):
Volume:大量的,通常我們的 MySQL 數(shù)據(jù)庫到達千萬級別的表都是大表了,但是在大數(shù)據(jù)系統(tǒng)中,千萬級別的數(shù)據(jù)日志是不值得引入大數(shù)據(jù)系統(tǒng)的。
Variety:數(shù)據(jù)類型繁多,不僅限于文本、日志,現(xiàn)在的系統(tǒng)包括圖形識別、影像分析等都已經(jīng)是大數(shù)據(jù)和 AI 系統(tǒng)的主力應(yīng)用了。
Value:價值。通過 ETL 在大量繁雜的數(shù)據(jù)中提取有價值的內(nèi)容,是大數(shù)據(jù)的核心。
Velocity:處理速度快。MySQL 千萬級的數(shù)據(jù)如果沒有好的索引性能就會很慘了,而大數(shù)據(jù)相關(guān)的數(shù)據(jù)庫如 HBase 、ClickHouse 之類的列式數(shù)據(jù)庫則是游刃有余,至于計算平臺就更不用說了。
Veracity:真實痕跡。通常我們需要分析的數(shù)據(jù)都是來源于各種各樣的信息系統(tǒng)、終端設(shè)備的用戶行為痕跡。
我沒做過大數(shù)據(jù)方面的開發(fā),但是 Hadoop、HBase、Spark 的大名還是聽說過的,沒事也自己搭過玩過,Google 大數(shù)據(jù)的三駕馬車通過開源的方式讓全世界為之一震。通過分布式的計算和存儲能力,讓大數(shù)據(jù)的快速分析變成了現(xiàn)實,甚至還有不少可以實現(xiàn)實時計算的框架,可以預(yù)見大數(shù)據(jù)發(fā)展的興旺勢頭。所有的頭部互聯(lián)網(wǎng)公司,沒有一個是不做大數(shù)據(jù)的,包括國家也在充分利用大數(shù)據(jù)的各種優(yōu)勢來實現(xiàn)之前說所的各種惠民工程。
不過,大數(shù)據(jù)同時也會帶來一些問題,比如個人隱私的問題。一個聽歌的或者一個拍照的 App 為啥非要通訊錄的權(quán)限?細思極恐。關(guān)注隱私保護、防范大數(shù)據(jù)詐騙和大數(shù)據(jù)犯罪行為也是我們所有 IT 從業(yè)人員的職業(yè)操守。
人工智能(Artificial Intelligence)是計算機科學(xué)的一個分支,它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器,該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。
說到人工智能就不得不提到大數(shù)據(jù),為什么呢?我們現(xiàn)在還處在比較初級的人工智能階段,通過 機器學(xué)習(xí) 來訓(xùn)練計算機對一些數(shù)據(jù)進行反饋,以獲得類似于人腦的結(jié)果,比如我們在文章頂部說過的 智能推薦 。其實就是根據(jù)你使用 App 的行為和各種來源的數(shù)據(jù),分析你可能會喜歡的內(nèi)容,當(dāng)你瀏覽或者點贊了相關(guān)的內(nèi)容,就會為你在這個類型的內(nèi)容上多加一分。這些,都需要有大數(shù)據(jù)做為支撐才可以實現(xiàn)。當(dāng)然,具體的實現(xiàn)遠沒有我說的這么輕松,但道理卻是差不多的。
其實人工智能的很多算法在很早以前就有了,只是當(dāng)時還沒有完善的大數(shù)據(jù)系統(tǒng)。因此,當(dāng) Google 的大數(shù)據(jù)框架誕生后,AI 也迎來了黃金時期,跟隨著大數(shù)據(jù)不斷地蓬勃發(fā)展。并且,AI 也是我們面向未來的一個技術(shù),《我,機器人》、《黑客帝國》、《終結(jié)者》都是我們對機械智能的幻想憧憬。雖說都是有點偏災(zāi)難性質(zhì)的吧,不過電影總是這樣才能有劇情吸引力嘛!真正對于現(xiàn)實的 AI 來說,未來還是應(yīng)該抱有更美好的期待的。
其實我覺得,移動互聯(lián)網(wǎng)真正興起并且蓬勃發(fā)展還是在 3G 網(wǎng)絡(luò)普及之后。當(dāng)然,這里有點片面了,真正的移動互聯(lián)網(wǎng)不只是包括 4G 、5G 這些的,還包括 WLAN 也就是 Wifi 網(wǎng)絡(luò),并且也不僅限于手機、平板,筆記本電腦、POS機等各種可以在移動狀態(tài)下(如室外、高鐵、公交)上使用互聯(lián)網(wǎng)資源的形式都是移動互聯(lián)網(wǎng)。
為什么說 3G 是一個重要的節(jié)點,因為在 3G 時代,微博大放異彩,同時出現(xiàn)了一個 “碎片化時間” 這樣一個名詞。這也就成了移動互聯(lián)網(wǎng)的一個顯著的特點,除了這個特點之外,還有 接入移動性、生活相關(guān)性、終端多樣性 這幾個特性共同組成了移動互聯(lián)網(wǎng)明顯區(qū)別于傳統(tǒng)互聯(lián)網(wǎng)的特性。
在移動互聯(lián)網(wǎng)時代,軟件開發(fā)技術(shù)也產(chǎn)生了一些變化,似乎桌面時代從 C/S 到 B/S 的過度在移動終端上又走了回去,我們?nèi)粘J褂玫母嗟倪€是各種需要安裝的 APP 。不過 小程序 也正在發(fā)力,SAP(單頁面應(yīng)用)的各種框架(Vue、React、Angular)也一直在蓬勃發(fā)展,B/S 應(yīng)用也是未來可期的,畢竟在小程序的概念出現(xiàn)以后,每個 APP 實際上都可以馬上變成一個瀏覽器實現(xiàn)自己的小程序應(yīng)用。除此之外,十年前 Android 和 IOS 開發(fā)的火爆場面也是非??鋸埖?,就像前幾年的大數(shù)據(jù)AI人才一樣,工資高得看不懂。當(dāng)然,現(xiàn)在早已降溫了,但原生開發(fā)依然還是移動端的主力開發(fā)方式。
最后就是 區(qū)塊鏈 ,信管師考試中一定會有一到兩道選擇題是最近最火的一些技術(shù)方面的,比如我當(dāng)時考試的時候就有區(qū)塊鏈相關(guān)的題目。至于現(xiàn)在最火的?無服務(wù)?低代碼?Web3.0?我也不太清楚了,好像有些年月沒有什么全網(wǎng)人盡皆知,大家紛紛種草的新技術(shù)概念了。
區(qū)塊鏈起源于比特幣,現(xiàn)在有幣的人可都是有錢人了。從科技層面來看,區(qū)塊鏈涉及數(shù)學(xué)、密碼學(xué)、互聯(lián)網(wǎng)和計算機編程等很多科學(xué)技術(shù)問題。從應(yīng)用視角來看,簡單來說,區(qū)塊鏈是一個分布式的共享賬本和數(shù)據(jù)庫,具有去 中心化、不可篡改、全程留痕、可以追溯、集體維護、公開透明等特點。這些特點保證了區(qū)塊鏈的“誠實”與“透明”,為區(qū)塊鏈創(chuàng)造信任奠定基礎(chǔ)。而區(qū)塊鏈豐富的應(yīng)用場景,基本上都基于區(qū)塊鏈能夠解決信息不對稱問題,實現(xiàn)多個主體之間的協(xié)作信任與一致行動。
原來聽過一個比較生動的解釋,是通過一個“村民買?!钡墓适聛碚f明區(qū)塊鏈到底是在干嘛,也不知道對不對:
在一個100人的村莊,張三向李四買了一頭牛,向他支付1萬元。過去,他要依靠中間人趙六,才能將自己的1萬元轉(zhuǎn)給李四。而有了區(qū)塊鏈系統(tǒng),張三可以直接將自己的1萬元記到李四的賬本上,同時交易信息會傳到全村,也就是整個區(qū)塊鏈系統(tǒng),使其他98個人也能看到信息。由系統(tǒng)記錄整個交易過程,具有可溯源優(yōu)勢,防止趙六賬本丟失或李四不認賬等問題。
和云計算類似,按使用范圍區(qū)塊鏈也有三種類型:
公有區(qū)塊鏈(Public Block Chains):世界上任何個體或者團體都可以發(fā)送交易,且交易能夠獲得該區(qū)塊鏈的有效確認,任何人都可以參與其共識過程。公有區(qū)塊鏈是最早的區(qū)塊鏈,也是應(yīng)用最廣泛的區(qū)塊鏈,各大bitcoins系列的虛擬數(shù)字貨幣均基于公有區(qū)塊鏈,世界上有且僅有一條該幣種對應(yīng)的區(qū)塊鏈。
聯(lián)合(行業(yè))區(qū)塊鏈(Consortium Block Chains):由某個群體內(nèi)部指定多個預(yù)選的節(jié)點為記賬人,每個塊的生成由所有的預(yù)選節(jié)點共同決定(預(yù)選節(jié)點參與共識過程),其他接入節(jié)點可以參與交易,但不過問記賬過程(本質(zhì)上還是托管記賬,只是變成分布式記賬,預(yù)選節(jié)點的多少,如何決定每個塊的記賬者成為該區(qū)塊鏈的主要風(fēng)險點),其他任何人可以通過該區(qū)塊鏈開放的API進行限定查詢。
私有區(qū)塊鏈(Private Block Chains):僅僅使用區(qū)塊鏈的總賬技術(shù)進行記賬,可以是一個公司,也可以是個人,獨享該區(qū)塊鏈的寫入權(quán)限,本鏈與其他的分布式存儲方案沒有太大區(qū)別。傳統(tǒng)金融都是想實驗嘗試私有區(qū)塊鏈,而公鏈的應(yīng)用例如bitcoin已經(jīng)工業(yè)化,私鏈的應(yīng)用產(chǎn)品還在摸索當(dāng)中
今天的內(nèi)容說實話,沒什么太重點的,但是呢,往往又會有那么一兩道題可能就跟這些東西有關(guān),要說完全地去硬背吧,好像也沒太大的必要。怎么說呢?當(dāng)成是擴展知識吧,有興趣的多了解一些,沒興趣的多看兩遍大概知道這些 大數(shù)據(jù)啊、人工智能啊、區(qū)塊鏈啊 是個什么東西就夠了。
新一代信息技術(shù)相關(guān)的內(nèi)容就是這些了,總體來說這一部分其實難度不高,各種概念其實我們現(xiàn)在的生活都比較接近,還是很好理解的。接下來我們要學(xué)習(xí)的又是一個非??菰?、難受、頭疼的部分了,那就是 信息系統(tǒng)安全技術(shù) 相關(guān)的內(nèi)容了。別說在座各位了,這部分我都有點發(fā)怵,但是,反過來說,這些知識多少會對你的工作生活有一些幫助,還是非常值得學(xué)習(xí)的,那么我們就一起加油吧!
參考資料:
《信息系統(tǒng)項目管理師教程》
《某機構(gòu)培訓(xùn)資料》