相信學(xué)醫(yī)的朋友都會有這樣的感受:突然收到來自親戚朋友的問候,同時(shí)被“順便”咨詢體檢發(fā)現(xiàn)的某處結(jié)節(jié),其中最常見的就是肺結(jié)節(jié)和甲狀腺結(jié)節(jié)。
這問題看似簡單,但其實(shí)并不那么容易回答。就比如甲狀腺結(jié)節(jié),很多人都有,但其中僅有約十分之一的結(jié)節(jié)是惡性的[1]。
目前對于結(jié)節(jié)良惡性的判斷(手術(shù)取得病理標(biāo)本之前),大多依靠醫(yī)生臨床經(jīng)驗(yàn)和影像評估,換個人來閱片或者評估甚至可能會得出相左的結(jié)論。
對于甲狀腺結(jié)節(jié)來說,即使進(jìn)行細(xì)針穿刺活檢(取少量細(xì)胞進(jìn)行檢測,目前術(shù)前最常用也是最可靠的檢測手段[2]),也有大概三分之一的病例仍然無法得到確切的診斷[3]。
近日,來自西湖大學(xué)的郭天南和李子青團(tuán)隊(duì),聯(lián)合新加坡國家癌癥中心的Oi Lian Kon和Narayanan Gopalakrishna Iyer團(tuán)隊(duì),在《細(xì)胞發(fā)現(xiàn)》雜志發(fā)表重要研究成果[4]。
他們通過人工智能(AI)的方式對甲狀腺結(jié)節(jié)蛋白質(zhì)組學(xué)進(jìn)行分析,建立了用于診斷結(jié)節(jié)良惡性的神經(jīng)網(wǎng)絡(luò)模型,準(zhǔn)確率達(dá)到90%以上。在外部驗(yàn)證隊(duì)列中,準(zhǔn)確率也在85%以上。
這是全球首個基于蛋白質(zhì)組學(xué)的甲狀腺結(jié)節(jié)良惡性診斷AI模型,具有很強(qiáng)的臨床轉(zhuǎn)化價(jià)值,其良好的準(zhǔn)確性或可使相當(dāng)一部分良性結(jié)節(jié)患者免于手術(shù)之苦。
文章首頁截圖
為了建立區(qū)分甲狀腺結(jié)節(jié)良惡性的AI模型,研究人員首先對來自新加坡總醫(yī)院578位病人的579個結(jié)節(jié)(共1724個福爾馬林固定石蠟包埋的組織樣本)進(jìn)行質(zhì)譜分析,獲得蛋白質(zhì)組數(shù)據(jù),并與其病理診斷相匹配,從而構(gòu)建神經(jīng)網(wǎng)絡(luò)模型。
研究的測試集來自于中國和新加坡12家醫(yī)院的回顧性福爾馬林固定石蠟包埋組織樣本數(shù)據(jù)(288個結(jié)節(jié)),和前瞻性隊(duì)列的細(xì)針穿刺活檢數(shù)據(jù)(294個結(jié)節(jié))。
在先前的研究中,郭天南團(tuán)隊(duì)已構(gòu)建了甲狀腺特異性的蛋白質(zhì)圖譜[5],通過統(tǒng)一流形逼近和投影(UMAP,一種數(shù)據(jù)降維算法)對數(shù)據(jù)進(jìn)行可視化后,他們發(fā)現(xiàn)乳頭狀甲狀腺癌(PTC)與其他組織顯著分離,而正常樣本(N)與多結(jié)節(jié)性甲狀腺腫(MNG)混雜在一起,濾泡性甲狀腺腺瘤(FA)和濾泡性甲狀腺癌(FTC)也無法分離。
這表明雖然良惡性結(jié)節(jié)的蛋白質(zhì)組是存在一定差異的(N、MNG和FA為良性,F(xiàn)TC和PTC為惡性),但無法通過蛋白質(zhì)組學(xué)的常規(guī)分析而直接區(qū)分良惡性結(jié)節(jié)(如FA何FTC)。
甲狀腺良惡性結(jié)節(jié)無法通過蛋白質(zhì)組學(xué)的常規(guī)分析而直接區(qū)分出來
緊接著,研究人員便想到通過神經(jīng)網(wǎng)絡(luò)模型來對良惡性結(jié)節(jié)進(jìn)行區(qū)分。
通過對579個結(jié)節(jié)樣本(40個N,203個MNG,137個FA,75個FTC和124個乳頭狀甲狀腺癌PTC)進(jìn)行三次交叉驗(yàn)證,最后選出了19個區(qū)分良惡性結(jié)節(jié)最準(zhǔn)確的蛋白。
AI模型構(gòu)建示意圖
篩選出的19個蛋白質(zhì)的詳細(xì)資料
由于目前臨床中甲狀腺結(jié)節(jié)被過度治療,因此在構(gòu)建模型時(shí)研究人員尤其關(guān)注模型診斷的特異性,同時(shí)保證較高的靈敏度。
相比于6個其他機(jī)器學(xué)習(xí)模型(SVM,LASSO,決策樹,MLP,隨機(jī)森林,Logistic回歸),以這19個選定的蛋白構(gòu)建的AI預(yù)測模型具有最高的AUC(0.93)。
UMAP也顯示,通過這19種蛋白,可將良惡性結(jié)節(jié)較好地區(qū)分。
以19個選定的蛋白構(gòu)建的AI預(yù)測模型具有良好的預(yù)測性能
隨后,研究人員在外部測試集中對該模型的預(yù)測性能進(jìn)行驗(yàn)證。
第一個測試集為288例福爾馬林固定石蠟包埋的組織樣本,其中144例為良性,其余144例為惡性。在該測試集中,AUC值可達(dá)到0.94,準(zhǔn)確性為89%,敏感性和特異性分別為84%和94%。
第二個測試集為來自9家醫(yī)院的294例細(xì)針穿刺活檢數(shù)據(jù),這一測試集的意義更為重大,因?yàn)楸狙芯康某踔允情_發(fā)在術(shù)前可用于預(yù)測結(jié)節(jié)良惡性的AI模型,而細(xì)針穿刺活檢則是術(shù)前最為普遍的檢測手段。在這一測試集中,AUC值同樣高達(dá)0.93,準(zhǔn)確率為85%,敏感性和特異性分別為92%和71%。
此外,研究人員還進(jìn)一步檢測了這個AI模型在不同Bethesda分類(甲狀腺細(xì)針穿刺細(xì)胞學(xué)活檢結(jié)果病理報(bào)告系統(tǒng))細(xì)針穿刺活檢樣本中的性能,結(jié)果顯示,對于Bethesda分類III和IV類的良惡性不確定的甲狀腺結(jié)節(jié),此AI模型的AUC值為0.89。
值得一提的是,細(xì)胞病理學(xué)家對Bethesda分類II、V和VI類樣本的總體診斷準(zhǔn)確率為82%,而本模型對這些相同結(jié)節(jié)的診斷準(zhǔn)確率為88%。
同時(shí),研究人員還指出,這個AI模型對于直徑≥1 cm結(jié)節(jié)的預(yù)測準(zhǔn)確率(87.7%)高于直徑<1 cm結(jié)節(jié)(75.8%)。這可能是由于小結(jié)節(jié)采樣的準(zhǔn)確性較差的緣故。
對于淋巴細(xì)胞浸潤明顯的結(jié)節(jié),這個AI模型難以將其與惡性結(jié)節(jié)區(qū)分開(淋巴細(xì)胞浸潤性結(jié)節(jié)預(yù)測準(zhǔn)確率為66%)。這可能是由于目前數(shù)據(jù)集所包括的淋巴細(xì)胞浸潤性樣本數(shù)量很少的緣故,從而導(dǎo)致了淋巴細(xì)胞性甲狀腺炎的診斷準(zhǔn)確性。
總的來說,這個研究構(gòu)建了首個基于蛋白質(zhì)組學(xué)對甲狀腺結(jié)節(jié)良惡性進(jìn)行預(yù)測的AI模型,僅通過19種蛋白,即可準(zhǔn)確地區(qū)分甲狀腺結(jié)節(jié)的良惡性,同時(shí)還有較高的敏感性和特異性。
同時(shí),該模型不僅適用于傳統(tǒng)的組織標(biāo)本,對于甲狀腺細(xì)針穿刺活檢所取得的少量細(xì)胞蛋白,此模型同樣具有很好的預(yù)測效果。
這一點(diǎn)在臨床中尤為重要,對于細(xì)針穿刺活檢無法明確性質(zhì)的結(jié)節(jié),通過這個模型進(jìn)行良惡性判斷,將會減少相當(dāng)多的良性結(jié)節(jié)病人做原本并不需要的手術(shù),具有很強(qiáng)的臨床意義。
參考文獻(xiàn):
1.Durante C, Grani G, Lamartina L, Filetti S, Mandel SJ, Cooper DS: The Diagnosis and Management of Thyroid Nodules: A Review. JAMA 2018, 319(9):914-924.
2.Faquin WC, Bongiovanni M, Sadow PM: Update in thyroid fine needle aspiration. Endocr Pathol 2011, 22(4):178-183.
3.Alexander EK, Kennedy GC, Baloch ZW, Cibas ES, Chudova D, Diggans J, Friedman L, Kloos RT, LiVolsi VA, Mandel SJ et al: Preoperative diagnosis of benign thyroid nodules with indeterminate cytology. N Engl J Med 2012, 367(8):705-715.
4.Sun Y, Selvarajan S, Zang Z, Liu W, Zhu Y, Zhang H, Chen W, Chen H, Li L, Cai X et al: Artificial intelligence defines protein-based classification of thyroid nodules. Cell Discov 2022, 8(1):85.
5.Sun Y, Li L, Zhou Y, Ge W, Wang H, Wu R, Liu W, Chen H, Xiao Q, Cai X et al: Stratification of follicular thyroid tumours using data-independent acquisition proteomics and a comprehensive thyroid tissue spectral library. Mol Oncol 2022, 16(8):1611-1624.