每周和你一起學(xué)習(xí)一些群體遺傳的知識,每周和你一起進步,歡迎回來!上一回介紹完基本的群體遺傳學(xué)的概念后,這周會給大家?guī)硪恍╆P(guān)于等位基因和基因型頻率的相關(guān)知識。如果還沒有看第一期的小伙伴,歡迎點擊下面的連接,進行跳轉(zhuǎn)閱讀。
在學(xué)習(xí)群體遺傳學(xué)時,我們會遇到很多陌生的概念。在深入理解對應(yīng)的難點之前,最重要的一件事就是先把基礎(chǔ)概念理解好掌握好。下面會列舉一些和這次內(nèi)容相關(guān)的重要概念,讓大家快速的學(xué)習(xí)和理解。
基因座(locus/loci):基因組中特定的位點?;蜃梢允强赡苁峭暾蚧騿蝹€核苷酸堿基對,如A-T。
等位基因(Alleles):在每個基因座中,通過突變產(chǎn)生的兩種或更多種基因的替代形式,并且都存在于染色體上的相同位置中。等位基因可以進一步分為主要的等位基因(major alleles)和次要等位基因(minor alleles),這兩個概念顧名思義就是根據(jù)等位基因出現(xiàn)的頻率來定,還記得我們平時用來過濾SNP的MAF條件嗎?其實MAF就是次要等位基因的出現(xiàn)頻率。
單一同態(tài)性的(monomorphic):如果一個群體中的所有個體都有相同的等位基因,可以稱這個基因座是具有單一同態(tài)性。
多態(tài)性(polymorphic):如果一個基因座中存在多個不同的等位基因,我們可以將這個基因座成為是具有多態(tài)性的。
同義替代(synonymous substitution):在編碼蛋白質(zhì)的基因的外顯子中,一個堿基與另一個堿基的進化取代,使得產(chǎn)生的氨基酸序列不變。
非同義替代(non-synonymous substitution):是改變蛋白質(zhì)的氨基酸序列的核苷酸突變。
單倍型(haplotype):在同一染色體上進行共同遺傳的多個基因座上等位基因的組合;通俗的說法就是若干個決定同一性狀的緊密連鎖的基因構(gòu)成的基因型。按照某一指定基因座上基因重組發(fā)生的數(shù)量,單倍型甚至可以指至少兩個基因座或整個染色體。
為了進一步加深對上面概念的理解,我們可以通過下面的圖例來對上述的概念進行進一步的理解:
簡單介紹一下這幅圖的信息:這個圖展示了來自三個果蠅群體的個體中直系同源的ADH基因座信息。
其中,D. melanogaster (第一排a-l)and D. simulans (第二排a-f)是姐妹物種,D. yakuba(第三排a-l)是一個近鄰的外群物種。這個表中的每一列都代表了來自每個個體的單倍型。這幅圖只顯示了具有不同等位基因的位點。在顯示的位點中,如果該個體的等位基因和參考序列一致,就用橫線表示。
位點834就是一個多樣性的位點,有些D. simulans個體具有C堿基的等位基因,但是其它物種就就具有T的堿基。固定差異位點是在存在物種之間的,但在物種個體內(nèi)是單態(tài)的。比如位點781,就是其中一個例子,只有D. melanogaster 的所有個體都具有等位基因堿基T,其它物種都和參考序列一樣。當(dāng)然我們還可以從不同的角度去看這些位點。比如就位點781來說,它也是一個非同義的突變位點。在位點1068中,等位基因T就是次要等位基因(該等位基因只占了少數(shù))。
等位基因頻率是群體遺傳分析的重要一部分,一般這個頻率是通過基因型的計數(shù)來計算的。假設(shè)兩個等位基因的二倍體常染色體基因座是分離的,分別為(A1 and A2)。N11和N12分別為A1A1純合子和A1A2雜合子的數(shù)目。N為總的二倍體群體中的個體數(shù)目。那么咱們就可以推導(dǎo)出A1A1的等位基因頻率( f11=N11/N
)和A1A2的等位基因頻率( f12=N12/N
)。
使用上面提到的公式,等位基因A1在群體中的等位基因頻率就等于:
q=1-p
)