1 大數據分析
科學心理學的目標包含“解釋”以及“預測”人的行為,兩者雖然從哲學角度來說是兼容并立的,然而在心理學的實際應用中卻并不完全相容甚至在一定程度上是矛盾的。研究者經常會面臨抉擇,建立一個擁有優(yōu)雅理論支撐的簡單模型、但預測力有限,亦或是以預測為目的、建立復雜模型期望模擬真實的數據生成過程、而對于內在機制的領悟程度也許并不完備。從另一個角度而言,前者更關注對于當前樣本的描述和解釋,雖然其可能未必適用于其他樣本;而后者則更重視跨樣本的預測能力,雖然犧牲一些對于當前樣本的預測準確性。傳統(tǒng)心理學研究 (用實驗法、問卷法去研究心理機制中的中介、調節(jié)效應)更多的重視解釋。
導致心理學研究重解釋、輕預測的其中一個原因在于對于預測工具的掌握程度(Yarkoni & Westfall,2017)。近年來,“可重復性危機”對很多傳統(tǒng)心理學研究結果提出了質疑,也提高了心理學研究對于方法學/量化統(tǒng)計分析的重視程度。應對可重復性危機,除了采用更加嚴謹的研究設計、恰當的統(tǒng)計方法進行數據分析和正確解讀結果之外,伴隨著更多更大量可及的數據資源和機器學習/統(tǒng)計學習等的興起,心理學/管理學研究也正在逐步發(fā)展出新的篇章——數據導向,從數據中探索規(guī)律與趨勢,以期達成預測的目的。重視預測與重視解釋并不必然互斥,數據中得到的洞察/模型可以引領新理論的誕生和對于既有理論的補充;如此,兩者便相輔相成了。
統(tǒng)計學習/機器學習的基本原理是借由把數據拆分為訓練集(Training set)與測試集(Test/Validation set),用訓練集訓練模型、選擇恰當參數,之后再用測試集來測試及衡量模型優(yōu)劣,從而防止過擬合(overfitting), 提高模型的外在效度(external validity)。P.s.,統(tǒng)計學習(Statistical Learning)和機器學習(Machine Learning)本質上是差不多的概念,機器學習更重視預測準確率、從數據中自動化地學習,統(tǒng)計學習在預測準確率的同時也強調對模型的解釋。由于差別些微,下文統(tǒng)一用機器學習表示。
2 統(tǒng)計/機器學習的方法
粗略區(qū)分,機器學習方法可以分為監(jiān)督學習(supervised learning)和非監(jiān)督學習(unsupervised learning)兩個大類。前者有非常明確的預測指標或因變量(例如回歸分析),而后者則不包括這一明確的預測指標(例如PCA主成分分析)。以下我們羅列一些最具有代表性的機器學習算法,供大家參考;當然機器學習是一個極其快速發(fā)展的領域,我們鼓勵讀者通過閱讀最新機器學習材料不斷更新自己的知識庫。
2.1監(jiān)督學習
2.1.1回歸(Regression)
(1)線性回歸,適用于因變量是連續(xù)變量的情況(Linear regression)
(2)邏輯斯蒂回歸,適用于因變量是非連續(xù)變量的情況(Logistic Regression)
(3)Ridge和Lasso回歸,帶有正則項(regularization)的回歸,對預測變量進行一定程度的篩選(regularization)
(4)非線性回歸,包括但不限于:多項式回歸(polynomial)、回歸曲線(splines)和廣義可加模型(Generalized additive model; GAM)
2.1.2基于樹的方法(Tree-based Methods)
(1)分類和回歸樹(classification and regression trees)
(2)通過不同方法構建多棵樹,包含聚集樹(Bagging)、隨機森林(Random Forest)和提升方法(Boosting)
2.1.3K-近鄰(K-Nearest Neighbor)
2.1.4支持向量機 (Support Vector Machine)
2.2非監(jiān)督學習
2.2.1主成分分析(Principal Component Analysis)
2.2.2聚類分析(Clustering)
3 統(tǒng)計/機器學習重要概念
3.1過擬合(Overfitting):統(tǒng)計模型的參數過多或者結構過于復雜,過于緊密的匹配訓練集,而無法良好地預測測試集或者其他的、新的樣本。機器學習模型在保障預測準確性的同時,通過訓練防止過度擬合。
3.2重采樣方法(Resampling methods):從訓練數據集上重復采樣得到多組訓練樣本,對每組樣本擬合一個模型,從這些模型中獲得額外的信息。
3.2.1交叉驗證(Cross-validation):k折交叉驗證(k-fold CV),留一驗證(LOOCV)。很多機器學習模型在訓練過程中需要通過交叉驗證“最優(yōu)化”其中參數的取值。
3.2.2自助(Bootstrap,音譯為拔靴法):這一方法在機器學習中常用來構建多個來源于同一個樣本,但卻不完全相同的重采樣樣本。
3.3正規(guī)化(Regularization):添加損失函數,對模型向量進行“懲罰”,選擇或者凸顯更加重要的預測變量,減少樣本變異的影響,從而避免過擬合問題。
4 用R進行大數據分析的學習資料
4.1 ISLR “An Introduction to Statistical Learning with Applications in R”(網站上可以下載書和 R codes)& 原作者錄制的YouTube Video lectures:總覽性的介紹了各種常用的大數據分析方法,以介紹概念為主,附帶很多實例輔助講解,數學原理的部分涉及不多。每一章節(jié)最后的Labs舉例示范如何在R中實現本章所詮釋的分析方法。此外,每一章節(jié)有差不多兩小時的YouTube 視頻教學,由作者Trevor Hastie和Robert Tibshirani親自講解,深入淺出,非常建議在閱讀章節(jié)前后觀看輔助學習。
(http://faculty.marshall.usc.edu/gareth-james/ISL/)
4.2 R for Data Science:介紹大數據分析在 R 中的實現
(https://r4ds.had.co.nz/)
4.3 Text Mining with R:介紹用R對文本數據進行挖掘分析,文本情感分析(sentiment analysis)等
(https://www.tidytextmining.com/)
4.4 統(tǒng)計學習進階教材:The Elements of Statistical Learning
(https://web.stanford.edu/~hastie/Papers/ESLII.pdf)
5 一些實例
5.1機器學習:從申請者的工作經歷來預測工作績效和離職率
從工作申請文件(之前的工作描述,所陳述的離職原因)中發(fā)展可解釋的變量,包括工作經驗相關度, 任期歷史, 非自愿的離職, 規(guī)避不好工作的經驗, 尋求更好工作的經驗等,運用機器學習各方法建立并比較模型,從而預測工作表現和未來離職意向。研究結果可以用來改善人才甄選方式。
5.2機器學習:用機器學習模型預測領導效能
用性格特質和360度回饋來預測領導效能:當數據維度低時,OLS線性回歸表現的最好;當數據維度逐漸增高,正規(guī)化回歸法(Lasso, Ridge) 能夠提供一些收益;當數據的維度很高時,隨機森林法表現得最好。
5.3機器學習:預測社會科學實驗的可重復性
用機器學習方法訓練預測模型、研究哪些變量對于可重復性最具有預測力,發(fā)現對于二分結果變量(可否重復)的交叉驗證準確率能達到70%,與同領域研究者的預測水平相當。最具有預測力的特征包括樣本量、原文的效應量、是否為主效應/交互效應。
5.4機器學習:Facebook點贊評估人格特質比人類評估更精確?
用Facebook用戶的點贊情況去預測其人格特質,比Facebook好友對其評價更加準確。電腦化人格判斷尤其在預測生活狀況(物質使用/政治態(tài)度/身體健康)時比自評人格特質有更高的外在效度。
5.5機器學習:游戲化、數據導向的人才甄選
用游戲化的方式(Gamified assessment)測量求職者的性格特質/認知能力,作為特征建立統(tǒng)計/機器學習模型,從而預測未來工作表現。藉由創(chuàng)造心流(flow)體驗,提升求職者的感受和投入、從而激發(fā)潛能,在傳遞競爭意識過程中也給予他們成就感和對公司的興趣。對于人才甄選具有實踐意義。
5.6網絡分析(network analysis):應用網絡分析研究組織行為議題
以誠信領導(authentic leadership)和員工工作投入的網絡分析為例,示范了如何用網絡分析去研究高維度數據心理變項之間是如何關聯。
5.7文字探勘(Text Mining):在管理學中的應用
(1)領導性格特質和用語習慣(Yarkoni,2010)
(2)從領導的采訪/愿景陳述和公司書面報告研究領導動機和公司愿景(Kirkpatrick, Wofford, & Baum, 2002)
(3)從演講和自傳 研究領導個人魅力和工作表現(House,Spangler, & Woycke, 1991)
(4)從員工間郵件和線上交流探索不同團體間的交流模式(Holton,2009)
(5)文字探勘的局限性:需要專業(yè)知識、文字資源,可能涉及倫理議題。
5.8動態(tài)計算模型(dynamic computational modeling)在組織心理學的應用
計算模型(computational models)可以用來模擬數據,以檢驗目標如何隨時間變化,以及系統(tǒng)中的各變量和情境如何隨時間發(fā)生變化。從而幫助挖掘理論的意義,并且根據理論作出預測 (Weinhardt & Vancouver, 2012)??梢詮V泛應用在組織管理學研究中:
(1)訓練和發(fā)展:e.g.,透過對學習過程進行建模,了解個體學習障礙的成因和可能的改善措施;組織的動態(tài)學習歷程;員工的社會化歷程;
(2)動機:e.g.,員工目標設定/自我規(guī)范的動態(tài)變化
(3)人才評估:e.g.,女性在職場升職的天花板效應
(4)團體合作:e.g,模擬團體內部信息交換如何影響團體決策
(5)員工的壓力和健康行為
(6)談判
6 為什么大數據分析可以被運用到心理學&管理學?
大數據分析可以彌補心理學研究中存在的重解釋、輕預測的狀況,尤其對于管理學而言,預測可能更有實踐意義。
從數據出發(fā)建模,幫助挖掘復雜的心理模型,改善傳統(tǒng)心理統(tǒng)計模型可能過于簡單的局限性,從而幫助理解人類行為背后的深層模式。
重視預測不應該被視為重視解釋的對立面。短期重視預測可以有助于理論模型的發(fā)展,從長遠看來也許能夠幫助解釋行為的成因。傳統(tǒng)實驗法(精心設計、具有高統(tǒng)計功效、隨機化、控制實驗) 與預測導向的大數據分析法可以相輔相成,最終有助于提升對理論的理解(Yarkoni & Westfall, 2017)。一個最顯著的例子是機器學習方法可以作為研究的第一步,從預測效度出發(fā)提出對于結果最具備預測效力的指標;在之后研究中將這些預測指標作為創(chuàng)新理論的一部分,通過驗證性方法證實/證否理論。
機器學習中的一些核心思想(例如防止過擬合,通過重采樣方法獲取更為豐富的信息)完全可以被其他心理學研究所借鑒和采納。
機器學習的結果評估指標不再是p值,而是混淆矩陣(confusion matrix)、AUC-ROC曲線、均方根誤差(RMSE)等,用機器學習作為研究方法一定程度上杜絕了傳統(tǒng)假設驗證性研究中基于p值的研究倫理問題(p-hacking)。
7 大數據分析的局限性?
大數據分析未必能夠考慮心理學&管理學研究中數據的結構性和因此產生的樣本之間的非獨立性,例如分層數據,縱向數據,基于同一對象不同來源的數據等等。當這一非獨立性沒有被充分考慮的時候,樣本的獨立性假設不再成立,因此產生的模型可能是有偏差(biased)的。
對于充滿噪音(noise)的心理學&管理學數據,大數據分析未必能夠很好處理。例如,測量誤差(measurement error)很好地通過驗證性因素分析加以控制,但卻通常無法在機器學習模型中被控制。
雖然機器學習模型可以提供關于預測變量預測效力的洞見,但是其還是無法提供關于因果的直接分析。當研究者感興趣因果分析的時候,我們推薦實驗法,或者是針對縱向數據的工具變量法,交叉滯后模型和時間序列模型。
本文作者:李冉冉 袁帥 李冉冉:心理學學術型研究生@UvAmsterdam,主修工業(yè)組織心理學,致力于用高等量化統(tǒng)計方法(例如機器學習/網絡分析等)從數據中獲取洞察,解釋和預測并進,提升改善組織/個體的績效和福祉。如有合適的短期研究項目歡迎合作(catherineranran@gmail.com)。 袁帥:博士就讀于世界不著名蒂爾堡大學,混搭社會心理學和數據科學研究,申花隊鐵桿粉絲。 圖文排版:陳陽 該文章由荷蘭心理統(tǒng)計聯盟原創(chuàng),未經授權,不得匿名轉載。轉載事宜后臺聯系,或郵件:infohpa2019@gmail.com