下圖是CNV數據分析的流程,供分析參考:(圖片來源于劉維強老師和盧建老師課件)
在分析解讀過程中,一般來說:
1. 缺失重復區(qū)域包含的基因及數目,基因越多越可能致病,包含的基因功能越重要,越可能致病;
2. 缺失重復區(qū)域證據收集,相關數據庫(DGV,DECIPHER等)以及文獻查詢,正常人檢出率越低和/或患者檢出率越高,致病性可能性越高;
3. 缺失比重復更可能具有致病性;
4. 新發(fā)(de novo)變異比遺傳的變異更可能具有致病性。
依據ACMG指南,建議將CNV分成三大類5級,分類的基本原則如下:
(1)致病性CNV:一段缺失或重復與一個已報道的微缺失/微重復綜合征致病區(qū)域在位置和大小上匹配,或缺失中包含因單倍劑量不足而致病的基因或基因的一部分,或重復中包含三倍劑量敏感基因的全部(有關單倍劑量不足和三倍劑量敏感基因可查詢ClinGen網站。另外涉及多個基因的大片段缺失(通常遠大于1 Mb)或重復也為致病性,特別是新發(fā)變異。因不完全外顯、表現多樣等原因,相同致病類CNV并不一定導致相同的臨床表型。
(2)可能致病性CNV(90%致病可能):一段缺失或重復與一個已報道的致病性缺失或重復有部分重疊,或涉及可疑但并未在疾病致病機制中證實的基因,或涉及的基因雖有支持單倍劑量不足或三倍劑量敏感的證據,但不足以得出肯定結論。
(3)臨床意義不明性CNV(VUS):此類變異不符合致病條件也不符合良性條件,文獻報道中的結論尚未一致,暫沒有足夠的證據做肯定的分類。
(4)可能良性CNV:含有基因的變異在正常人群中多次發(fā)生,但發(fā)生率未達1%。
(5)良性CNV:涉及的CNV在DGV數據庫或內部數據庫中的發(fā)生率>1%;或該CNV已在多個同行審議的出版物或經審校的數據庫(如ClinVar)中報告為良性;或正常人群中有發(fā)生,但不到1%的發(fā)生率,CNV不包含任何基因或重要的基因組成部分。
在看檢測報告的時候,因檢測結果大多是術語縮寫,不夠直觀明了,例如:arr[hg19]3q28(188465893-189665334)X1 ,以下列出的常見符號和術語縮寫,有助于看檢測結果:
add | 額外未知起源的染色體片段 |
方括號[ ] | 描述細胞數目或采用的基因組版本號 |
cen | 著絲粒 |
chr | 染色體 |
dic | 雙著絲粒體 |
del | 缺失 |
der | 衍生染色體 |
dn(de novo) | 新發(fā)染色體畸變 |
dup | 重復 |
h | 異染色質 |
hmz | 純合的,純合性 |
htz | 雜合的,雜合度 |
inh | 遺傳性的 |
ins | 插入 |
inv | 倒位 |
mar | 標記染色體 |
mat | 母方起源 |
— (減號) | 丟失 |
mos | 嵌合體 |
p | 染色體短臂 |
pat | 父親起源 |
+(加號) | 獲得 |
q | 染色體長臂 |
qs | 染色體長臂上的隨體 |
qter | 長臂末端 |
?(問號) | 對某一染色或染色體結構的疑問 |
r | 環(huán)狀染色體 |
rob | 羅賓遜易位 |
s | 隨體 |
t | 易位 |
ter | 末端(染色體末端) |
upd | 單親二體 |
案例1