關(guān)于大數(shù)據(jù)的神奇,《大數(shù)據(jù)時代》引述了一個故事。
一天,一個男人沖進了一家位于明尼阿波利斯市郊的塔吉特商店,要求經(jīng)理出來見他。他氣憤地說:“我女兒還是高中生,你們卻給她郵寄嬰兒服和嬰兒床的優(yōu)惠券,你們是在鼓勵她懷孕嗎?”而當(dāng)幾天后,經(jīng)理打電話向這個男人致歉時,這個男人的語氣變得平和起來。他說:“我跟我的女兒談過了,她的預(yù)產(chǎn)期是8月份,是我完全沒有意識到這個事情的發(fā)生,應(yīng)該說抱歉的人是我?!睘槭裁匆粋€商店竟然會比一個女兒的父親還了解她?因為,塔吉特公司通過大數(shù)據(jù)的分析注意到,登記簿上的婦女會在懷孕大概第三個月的時候買很多無香乳液。幾個月后,她們會買一些養(yǎng)品,比如鎂、鈣鋅。公司最終找出了大概20多種關(guān)聯(lián)物,這些關(guān)聯(lián)物可以給顧客進行“懷孕趨勢”評分。這樣就能夠在孕期的每個階段給客戶寄送相應(yīng)的優(yōu)惠券,從而掌握銷售的主動。
類似的案例還有沃爾瑪公司在季節(jié)性颶風(fēng)來臨時,會把手電筒與蛋撻放在一起,這也是基于大數(shù)據(jù)的分析;被同樣發(fā)現(xiàn)的一個很有意思的現(xiàn)象是,嬰兒尿布和啤酒有很高的相關(guān)度,即跟尿布一起購買最多的商品竟然是啤酒,這大概是那些初為人父的男人們一種無奈的習(xí)慣!
上述的案例還僅僅是大數(shù)據(jù)的冰山一角。事實上,大數(shù)據(jù)時代,每個人都是數(shù)據(jù)的貢獻者。有關(guān)研究預(yù)計,到2020年一個中國普通家庭一年產(chǎn)生的數(shù)據(jù)相當(dāng)于半個國家圖書館的信息儲量。利用互聯(lián)網(wǎng)搜索信息,用微信、QQ維護社交關(guān)系,上網(wǎng)購物,都會產(chǎn)生海量數(shù)據(jù)。于是大數(shù)據(jù)在今天也就無孔不入,無處不在了。
互聯(lián)網(wǎng)上的每一次點擊、每一次搜索,都是數(shù)據(jù),商家將海量數(shù)據(jù)整合分析,就能獲知不同群體的偏好和習(xí)慣,實現(xiàn)精準(zhǔn)營銷,這樣的應(yīng)用其實已經(jīng)普遍應(yīng)用于互聯(lián)網(wǎng)廣告業(yè)。比如,同時打開一個同樣的網(wǎng)頁,不同的個人電腦上出現(xiàn)的廣告卻是不同的,女性朋友的頁面可能是很多服飾類廣告,而男性朋友可能是電子產(chǎn)品的廣告。如果在網(wǎng)上購書,可能會經(jīng)常發(fā)現(xiàn),網(wǎng)站給你的推薦,很多確實是你想買的,這是因為圖書網(wǎng)站分析了你的瀏覽網(wǎng)頁數(shù)據(jù)和購物記錄,推導(dǎo)出你的消費習(xí)慣和可能需要,從而精準(zhǔn)地投放廣告。
既然大數(shù)據(jù)如此神奇,問題便隨之而來,個人能否在大數(shù)據(jù)的年代獨善其身?答案是否定的。網(wǎng)絡(luò)匿名在網(wǎng)絡(luò)上并沒有作用,只要想找得到真實的改名,則通過大數(shù)據(jù)分析就可以精確找到。因為,大數(shù)據(jù)通過相關(guān)性分析,照樣可以精確地推斷出匿名的是誰??梢哉f,在海灘上游泳,只有退潮時才知道誰在裸泳,而互聯(lián)網(wǎng)上則已經(jīng)是人人都在裸泳,只要上網(wǎng)、上微信、上博客,個人信息都會被獲取,最終通過數(shù)據(jù)的收集與分析推斷出匿名的人是誰。比如《紐約時報》曾經(jīng)在幾天內(nèi)通過搜索記錄的綜合分析,發(fā)現(xiàn)數(shù)據(jù)庫中的4417749號代表的是佐治亞州利爾本的一個62歲寡婦塞爾瑪·阿諾德,記者據(jù)此找到了本人。當(dāng)然,這事引起了公憤,最終當(dāng)事的技術(shù)官和兩名員工被開除。美國在線的案例表明,我們被我們所搜索的內(nèi)容出賣了!
不僅大數(shù)據(jù)讓你的過去無處可藏,而且讓你的現(xiàn)在像玻璃一樣透明,更要命的是,大數(shù)據(jù)的分析而不是信息的竊取就能讓你的未來行為或工作計劃提前曝光,一目了然。于是在國外出現(xiàn)了警察依據(jù)大數(shù)據(jù)分析對一個可能要行兇的人提前進行逮捕的事例,迅速地引起了法律與道德上的爭論。一個重要的問題是,一個人有了行兇的念頭,是不是就必然犯罪;況且,在一個人沒有犯罪的時候,依靠數(shù)據(jù)分析就宣布他的罪行,又在法律上如何解釋?
這樣,一個重要的道德和安全疑慮便產(chǎn)生了,在大數(shù)據(jù)的年代,誰來保證個人的隱私不泄露,個人的信息安全受保護,特別是因為個人信息泄露而帶來的人身安全誰來負(fù)責(zé)?比如谷歌的街景,可以詳細(xì)到將沿街的每戶住宅場景予以發(fā)布,如果你不愿意,可以用涂白來標(biāo)示,這可能會引起更多人的關(guān)注,包括盜賊在內(nèi)。怎么辦?《大數(shù)據(jù)時代》提出的觀點是,不能再由客戶來負(fù)責(zé),簽訂所謂的隱私信息授權(quán)書,而是應(yīng)該由用到個人數(shù)據(jù)的企業(yè)來負(fù)責(zé),由企業(yè)向客戶申請數(shù)據(jù)的使用權(quán)并承諾隱私保護,在使用數(shù)據(jù)后及時刪除。百度公司發(fā)展研究中心副主任率鵬說,“個人隱私,比如用戶登錄信息泄露,其實不是大數(shù)據(jù)帶來的問題,而是企業(yè)沒有盡到相關(guān)信息保護責(zé)任。在法律法規(guī)的約束下,如果企業(yè)盡到責(zé)任的話,還是有能力保障大數(shù)據(jù)時代用戶信息安全問題的?!笨墒窃谥袊漠?dāng)下,公眾又該如何相信這些使用數(shù)據(jù)的公司們的承諾呢?又以什么法律制度去保駕護航?
(二〇一四年三月四日夜)