該文結(jié)合已發(fā)表的研究論文,從研究設(shè)計、統(tǒng)計分析與結(jié)果報告3方面涉及的統(tǒng)計學(xué)問題入手,進(jìn)行逐條解讀,以闡明醫(yī)學(xué)論文應(yīng)達(dá)到的統(tǒng)計報告要求。之前小咖分享了研究設(shè)計部分(一表總結(jié):醫(yī)學(xué)期刊的統(tǒng)計報告要求),今天我們繼續(xù)分享統(tǒng)計分析和結(jié)果報告要求。
統(tǒng)計分析
1、缺失值的處理:
缺失值是人群研究中不可避免的問題,其處理方式的差異可能在不同程度上引入偏倚,因此,詳細(xì)報告數(shù)據(jù)清理過程中缺失值的處理方法有助于讀者對潛在偏倚風(fēng)險進(jìn)行評價。
例如,瑞舒伐他汀試驗在統(tǒng)計分析部分詳細(xì)說明了缺失值的填補(bǔ)策略,包括:將二分類結(jié)局中的缺失值視為未發(fā)生事件;將生物標(biāo)志物和心電圖測量中的缺失值進(jìn)行多重填補(bǔ)(multiple imputation);為了證明缺失值處理的合理性和填補(bǔ)結(jié)果的穩(wěn)定性,研究還比較了多重填補(bǔ)與完整數(shù)據(jù)(complete-case)分析的結(jié)果。
2、數(shù)據(jù)的預(yù)處理:
實施統(tǒng)計分析之前往往需要將原始數(shù)據(jù)進(jìn)行預(yù)處理,如:對連續(xù)變量進(jìn)行函數(shù)轉(zhuǎn)換使其更接近正態(tài)分布,基于原始數(shù)據(jù)構(gòu)建衍生變量,將連續(xù)變量拆分為分類變量或?qū)⒎诸愖兞康牟煌悇e進(jìn)行合并等。醫(yī)學(xué)論文應(yīng)報告處理原始數(shù)據(jù)的方法及依據(jù),瑞舒伐他汀試驗即在統(tǒng)計分析部分描述了對血液生物標(biāo)志物的對數(shù)轉(zhuǎn)換。
3、變量分布特征描述:
確定統(tǒng)計分析使用的變量,并針對每一個變量的分布特征進(jìn)行描述,是決定研究選用何種統(tǒng)計分析方法的基礎(chǔ)。醫(yī)學(xué)期刊雖然普遍對此提出要求,但作者往往套用常用方法,如:連續(xù)變量符合正態(tài)分布時,采用均數(shù)(標(biāo)準(zhǔn)差)描述,否則采用中位數(shù)(四分位間距)描述;分類變量采用頻數(shù)(百分比)描述等。
事實上,應(yīng)根據(jù)研究設(shè)計類型、統(tǒng)計分析目的和數(shù)據(jù)特征選擇恰當(dāng)?shù)拿枋龇椒?/strong>。例如,CKB選擇采用年齡、性別和地區(qū)校正的均值和率來描述人群分布特征,而非簡單的報告連續(xù)變量的均數(shù)和分類變量的構(gòu)成比。
4、主要分析(primary analysis):
指針對研究結(jié)局的統(tǒng)計分析,是研究論文的核心證據(jù)。因此,醫(yī)學(xué)論文應(yīng)詳細(xì)描述主要分析的實施過程和適用性。
在試驗性研究中,應(yīng)明確統(tǒng)計分析數(shù)據(jù)集、試驗效應(yīng)指標(biāo)、相對或絕對風(fēng)險及其置信區(qū)間的計算方法、以及假設(shè)檢驗的方法。
例如,瑞舒伐他汀試驗采用意向性分析(intention to treat)數(shù)據(jù)集,通過計算OR值及其95%CI來評價術(shù)后房顫發(fā)生風(fēng)險在試驗組與對照組間的差異,置信區(qū)間包含1說明研究結(jié)果不拒絕原假設(shè),即兩組的術(shù)后房顫發(fā)生風(fēng)險相等;考慮到重復(fù)測量的需要,采用協(xié)方差分析比較兩組術(shù)后6~120 h肌鈣蛋白Ⅰ釋放曲線下面積的對數(shù),并計算其均值的絕對差異及其95%CI來評價圍術(shù)期心肌損傷情況在試驗組與對照組間的差異,置信區(qū)間包含0說明研究結(jié)果不拒絕原假設(shè),即兩組的圍術(shù)期心肌損傷情況相同。
在觀察性研究中,通常采用多因素統(tǒng)計模型來控制混雜,此時應(yīng)明確定義因變量、自變量及潛在的混雜變量或效應(yīng)修正因子,描述變量轉(zhuǎn)換的方法和變量篩選的過程,并預(yù)先說明論文報告哪一種統(tǒng)計模型的結(jié)果。如果采用讀者并不熟悉的統(tǒng)計分析方法,還應(yīng)詳細(xì)介紹該統(tǒng)計分析方法的原理。
例如,CKB采用Cox比例風(fēng)險回歸模型分析水果攝入與心血管事件之間的關(guān)聯(lián),因變量為心血管事件,包括心血管死亡、主要冠狀動脈事件、出血性卒中、缺血性卒中、其他缺血性心臟病和其他腦血管??;
自變量為水果攝入頻率,即每天、4~6 d/周、1~3 d/周、每月、極少或從不;分層變量為年齡、性別和地區(qū);同時模型調(diào)整了基線的混雜變量;
為了幫助多個暴露類別之間的比較,研究采用浮動絕對風(fēng)險的方法(floating-absolute-risk method)估計危險比的變異程度,并與傳統(tǒng)的不浮動絕對風(fēng)險的方法進(jìn)行比較。
5、其他分析:
如果研究在主要分析之外,還進(jìn)行了其他輔助分析(ancillary analysis),如敏感性分析(sensitivity analysis)或亞組分析(subgroup analysis),應(yīng)在統(tǒng)計分析部分給予充分說明。
如果是事后分析(post-hoc analysis),應(yīng)考慮潛在的Ⅰ類錯誤膨脹問題。例如,瑞舒伐他汀試驗在主要分析的基礎(chǔ)上,根據(jù)基線年齡(≤60歲或>60歲)、性別、他汀用藥史(是或否)等變量分亞組比較主要結(jié)局指標(biāo)在試驗組與對照組間的差異。但是,由于該亞組分析在研究設(shè)計時已預(yù)先設(shè)定(pre-specify),因此無需對顯著性水平進(jìn)行調(diào)整。
6、多重比較:
除了常規(guī)使用的統(tǒng)計分析方法外,作者還應(yīng)特別注意多重比較的問題。
例如,瑞舒伐他汀試驗設(shè)置了兩個平行的主要結(jié)局指標(biāo):術(shù)后房顫和圍術(shù)期心肌損傷,原則上應(yīng)調(diào)整顯著性水平以控制總體Ⅰ類錯誤概率。然而,由于研究假設(shè)兩個主要結(jié)局指標(biāo)同時達(dá)到組間差異有統(tǒng)計學(xué)意義才算試驗陽性,且在估算樣本量時已對此給予了充分考慮,因此無需考慮多重檢驗的問題(without allowance for multiple testing)。
7、Ⅰ類錯誤概率與統(tǒng)計軟件:
醫(yī)學(xué)論文應(yīng)對統(tǒng)計檢驗的Ⅰ類錯誤概率(單/雙側(cè))及統(tǒng)計軟件進(jìn)行說明。例如,兩部分?jǐn)?shù)據(jù)分別采用SAS 9.3和Stata 13.0軟件進(jìn)行分析,所有檢測均為雙側(cè)檢驗,P<0.05為差異有統(tǒng)計學(xué)意義。
結(jié)果報告
1、研究對象的納入流程:
醫(yī)學(xué)期刊推薦使用研究對象流程圖來描述研究對象的納入流程、研究實施過程中的失訪或無應(yīng)答、以及最終的統(tǒng)計分析數(shù)據(jù)集等信息,見圖 1。研究對象流程圖的展示可以為研究對象是否存在選擇偏倚、研究結(jié)果的可外推范圍等提供重要證據(jù)。
圖1 瑞舒伐他汀試驗的研究對象流程圖
注:a患者可能被多種原因排除;b接受手術(shù)患者的百分比;所有生化測量的缺失值百分比范圍為5.0%~7.5%,除了sCD40L(17.5%)
2、基線數(shù)據(jù)比較:
醫(yī)學(xué)期刊通常要求分組報告基線變量的分布特征,但在組間比較時可以不做假設(shè)檢驗,不標(biāo)注P值,見表 2。因為,在大樣本研究中,絕對差異的微小改變都可能造成統(tǒng)計學(xué)顯著,而該差異本身并不一定具有臨床意義。另一方面,在樣本量較小的隨機(jī)對照試驗中,即便采用了嚴(yán)格的隨機(jī)分組策略,仍會有個別變量無法達(dá)到組間可比,此時,如果預(yù)先對基線數(shù)據(jù)進(jìn)行組間比較,作者可能會選擇性不報告組間差異有統(tǒng)計學(xué)意義的變量,而導(dǎo)致選擇性報告偏倚。
表2. 瑞舒伐他汀試驗的研究對象基線特征(節(jié)選)
3、效應(yīng)估計與置信區(qū)間:
醫(yī)學(xué)論文在報告統(tǒng)計結(jié)果時不應(yīng)僅依賴于P值,還應(yīng)給出量化的效應(yīng)估計結(jié)果,同時評價其測量誤差或不確定性,如報告95%CI(如有必要,可根據(jù)顯著性水平對置信系數(shù)進(jìn)行調(diào)整。因為P值無法反映關(guān)于效應(yīng)大小和估計精度的重要信息,只能說明統(tǒng)計學(xué)意義,而損失對臨床意義的表達(dá)。
SAMPL指南建議研究者給出臨床意義的最小界值,以幫助讀者根據(jù)點估計及置信區(qū)間判斷研究的臨床意義。中華流行病學(xué)雜志則提出,當(dāng)P值小于Ⅰ類錯誤概率時,應(yīng)說“組間差異有統(tǒng)計學(xué)意義”,而不應(yīng)說“組間有顯著性差異”。例如,CKB在評價研究因素對結(jié)局的發(fā)生風(fēng)險時,報告了危險比及其95%CI。
4、結(jié)果與方法一一對應(yīng):
醫(yī)學(xué)論文應(yīng)保證研究結(jié)果與方法一一對應(yīng),如:在方法中介紹了基線的統(tǒng)計描述與組間比較的具體方法,應(yīng)在結(jié)果中對基線數(shù)據(jù)進(jìn)行相應(yīng)的描述與比較;在方法中說明了研究的主要分析方法,應(yīng)在結(jié)果中對主要結(jié)局指標(biāo)的估計或假設(shè)檢驗結(jié)果進(jìn)行報告;在方法中提出了其他分析,包括敏感性分析、亞組分析等,應(yīng)在結(jié)果中羅列出相應(yīng)內(nèi)容。
例如,瑞舒伐他汀試驗在方法部分說明研究將對主要結(jié)局指標(biāo)、次要結(jié)局指標(biāo)分別進(jìn)行組間比較,并對主要結(jié)局指標(biāo)進(jìn)行亞組分析;在結(jié)果部分則依次報告了相應(yīng)結(jié)果。
5、傷害:
需要注意的是,無論是試驗性研究還是觀察性研究,都有可能存在傷害研究對象的風(fēng)險。醫(yī)學(xué)論文應(yīng)如實報告研究過程中發(fā)生的傷害。
例如,噻托溴銨試驗報告了試驗組與對照組的不良事件發(fā)生情況:除了輕度不良事件(如口咽不適)外,其他不良事件、嚴(yán)重不良事件和死亡發(fā)生率的組間差異均無統(tǒng)計學(xué)意義。
6、P值的報告規(guī)范及保留小數(shù)位數(shù):
不同醫(yī)學(xué)期刊對P值的報告規(guī)范有不同要求。例如,NEJM規(guī)定,除非研究設(shè)計需要進(jìn)行單側(cè)檢驗,如非劣效性試驗,其他報告的P值均應(yīng)為雙側(cè)。P值大于0.01應(yīng)報告小數(shù)點后兩位;P值在0.01到0.001之間應(yīng)報告小數(shù)點后三位;P值小于0.001應(yīng)報告為P<0.001。在分層分析中,只需報告層間比較差異有統(tǒng)計學(xué)意義的P值,而不需報告所有層間兩兩比較的P值。
CMJ(Engl)規(guī)定,應(yīng)使用大寫斜體,并報告P值的精確值(如果P值在0.001~0.05之間時)。中華醫(yī)學(xué)雜志規(guī)定,應(yīng)盡可能給出具體的P值。中華流行病學(xué)雜志規(guī)定,應(yīng)給出P值的實際數(shù)值,并保留3位小數(shù)。在使用不等式表示P值時,選用P>0.05、P<0.05和P<0.01即可滿足需求,無須細(xì)分P<0.001或P<0.000 1。
可以看出,目前醫(yī)學(xué)期刊對P值的報告尚無統(tǒng)一規(guī)范,導(dǎo)致一些研究僅給出P值與顯著性水平之間的不等關(guān)系,而不體現(xiàn)量化的數(shù)值(如P>0.05);一些研究則盲目追求P值的精度,而保留不必要的小數(shù)位數(shù)(如P=0.0357)。
7、統(tǒng)計表規(guī)范:
統(tǒng)計表可以簡明、高效地展示研究的關(guān)鍵信息。ICMJE對統(tǒng)計表的要求包括:依照正文的引用順序連續(xù)編碼,并確保每個表都在正文中被引用;設(shè)置簡短清晰的表標(biāo)題,使讀者可以直接理解表中內(nèi)容而無需閱讀上下文;設(shè)置簡短清晰的縱標(biāo)目與橫標(biāo)目,并在腳注中解釋標(biāo)目涉及的細(xì)節(jié)問題;在腳注中解釋所有表中的非標(biāo)準(zhǔn)縮寫,同時明確變異特征,如標(biāo)準(zhǔn)差或標(biāo)準(zhǔn)誤;如果表中用到其他來源的已發(fā)表或未發(fā)表的數(shù)據(jù),應(yīng)獲取許可并充分引用,見表 2。
8、統(tǒng)計圖規(guī)范:
統(tǒng)計表用于展示數(shù)據(jù)的精確數(shù)值,而統(tǒng)計圖則提供對數(shù)據(jù)的全面評估。ICMJE對統(tǒng)計圖的要求包括:依照正文的引用順序連續(xù)編碼,并確保每張圖都在正文中被引用;如果圖片已經(jīng)發(fā)表,應(yīng)獲取許可并充分引用;如果存在符號、箭頭、數(shù)字或字母用于標(biāo)記圖片,需在圖例中逐一解釋,見圖 1。不同雜志還會對圖片的格式和大小進(jìn)行進(jìn)一步要求。統(tǒng)計圖表達(dá)方式的創(chuàng)新有助于讀者快速掌握研究的核心結(jié)果。
9、圖表內(nèi)容不重復(fù):
醫(yī)學(xué)論文的圖表內(nèi)容不應(yīng)重復(fù),且不應(yīng)在文中復(fù)述圖表中的所有數(shù)據(jù);應(yīng)僅強(qiáng)調(diào)或總結(jié)最重要的結(jié)果。
例如,瑞舒伐他汀試驗在結(jié)果部分依次用圖表展示了基線、主要結(jié)局指標(biāo)及亞組分析、共同主要結(jié)局指標(biāo)和次要結(jié)局指標(biāo)的相關(guān)內(nèi)容。
總結(jié)
本文從研究設(shè)計、統(tǒng)計分析、結(jié)果報告3方面涉及的統(tǒng)計學(xué)問題入手,對醫(yī)學(xué)期刊的統(tǒng)計報告條目及內(nèi)容進(jìn)行歸納,并借助試驗性研究和觀察性研究論文,對其進(jìn)行逐條解讀,以闡明醫(yī)學(xué)論文統(tǒng)計報告應(yīng)達(dá)到的基本要求。
本文發(fā)現(xiàn),英文醫(yī)學(xué)期刊普遍參考ICMJE提出的“醫(yī)學(xué)期刊學(xué)術(shù)著作實施、報告、編輯和發(fā)表建議”及EQUATOR協(xié)作網(wǎng)發(fā)布的針對多種研究設(shè)計類型的報告聲明等規(guī)范性文件,對于醫(yī)學(xué)研究的統(tǒng)計報告已有詳細(xì)規(guī)定。
而中文醫(yī)學(xué)期刊通常采用編輯部自行刊發(fā)的對統(tǒng)計學(xué)方 法的要求,雖然對統(tǒng)計分析的格式和內(nèi)容有具體說明,但并不充分,建議根據(jù)國際規(guī)范完善現(xiàn)行的統(tǒng)計報告要求。
需要注意的是,本文介紹的統(tǒng)計報告條目是不同研究設(shè)計類型均可能涉及的共性問題,當(dāng)研究者在進(jìn)行論文撰寫時,應(yīng)根據(jù)自身的研究設(shè)計類型、研究目的與學(xué)術(shù)期刊要求選擇參考適用的條目,而非逐一報告。本文有望幫助研究者了解醫(yī)學(xué)研究的統(tǒng)計報告要求,從而切實提高醫(yī)學(xué)論文的統(tǒng)計報告質(zhì)量。
內(nèi)容來源:嚴(yán)若華,彭曉霞. 醫(yī)學(xué)期刊統(tǒng)計報告要求的詳述與解讀[J]. 中華流行病學(xué)雜志, 2019, 40(1): 99-105.