开心六月综合激情婷婷|欧美精品成人动漫二区|国产中文字幕综合色|亚洲人在线成视频

    1. 
      
        <b id="zqfy3"><legend id="zqfy3"><fieldset id="zqfy3"></fieldset></legend></b>
          <ul id="zqfy3"></ul>
          <blockquote id="zqfy3"><strong id="zqfy3"><dfn id="zqfy3"></dfn></strong></blockquote>
          <blockquote id="zqfy3"><legend id="zqfy3"></legend></blockquote>
          打開(kāi)APP
          userphoto
          未登錄

          開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

          開(kāi)通VIP
          GWAS中的effect與數(shù)量遺傳學(xué)中的替換效應(yīng)

          大家好,我是鄧飛,雖然,我早就知道GWAS分析中的effect值,就是數(shù)量遺傳學(xué)的基因中的替換效應(yīng),但是一直沒(méi)有仔細(xì)閱讀相關(guān)材料。今天通過(guò)閱讀數(shù)量遺傳學(xué)的教程,理解了這個(gè)概念,真好。并且通過(guò)R語(yǔ)言模擬數(shù)據(jù),驗(yàn)證了這個(gè)結(jié)論,紙上得來(lái)終覺(jué)淺,絕知此事要躬行!

          同時(shí),根據(jù)公式推導(dǎo),可以更貼切的知道BLUP育種值的含義,我們?yōu)楹我鶕?jù)育種值進(jìn)行選擇,選擇后會(huì)發(fā)生什么,加性效應(yīng),顯性效應(yīng)對(duì)于單位點(diǎn)SNP如何計(jì)算,對(duì)于PRS,MAS,GS的理解都是非常重要的。

          1. GWAS中的effect

          這里,GWAS中的回歸系數(shù),effect,beta,都是一個(gè)意思。

          因?yàn)镚WAS分析中,單點(diǎn)檢測(cè),類(lèi)似回歸分析,effect就是SNP回歸系數(shù)beta,p值就是SNP的P-value。

          比如數(shù)據(jù):

          用R語(yǔ)言擬合模型:

          mod_M7 = lm(phe.V3 ~ M7_1,data=dd)
          summary(mod_M7)

          這里的M7位點(diǎn),effect是1.394,p值是0.29。

          下圖用GWAS的GLM模型展示,兩者結(jié)果是一致的。

          2. 數(shù)量遺傳學(xué)中的替換效應(yīng)

          2.1 加性效應(yīng)和顯性效應(yīng)

          首先,先看一下加性效應(yīng)和顯性效應(yīng)的定義:

          舉個(gè)栗子比如:

          • A2A2的平均值是:20
          • A1A2的平均值是:17
          • A2A2的平均值是:10

          那么:

          • 平均值是m = (10+20)/2 =15
          • 加性效應(yīng)的值是a = (20-10)/2 =5
          • 顯性效應(yīng)的值是d = 17-15=2

          2.2 期望和方差

          假定一個(gè)位點(diǎn)的次等位基因頻率是p,主等位基因頻率是q,而且該位點(diǎn)滿足哈溫平衡,所以:

          整體均值為:

          整體方差:

          2.3 等位基因平均效應(yīng)

          ?

          一種定義等位基因效應(yīng)的方法,是利用后代群體的平均表現(xiàn)與隨機(jī)交配群體均值的離差進(jìn)行計(jì)算。以等位基因A1為例,把它視為配子,與群體中其他配子隨機(jī)結(jié)合產(chǎn)生一個(gè)后代群體,其他配子基因型既有A1也有A2,它們的頻率分別為p和q。因此,配子A1產(chǎn)生后代群體中的基因型有A1A1和A1A2兩種,頻率也分別為p和q。根據(jù)配子A1后代群體的基因型頻率,就能得到后代群體的均值為pa+qd,從中減去隨機(jī)交配群體的均值μ,就得到等位基因A1的效應(yīng) 。類(lèi)似地,我們還可以得到等位基因A2平均效應(yīng) 。對(duì)于復(fù)等位基因,可用同樣的方法定義它們的平均效應(yīng)。

          ?

          2.4 替換效應(yīng)(substitution effect)

          ?

          育種過(guò)程中,當(dāng)選擇有利于某個(gè)等位基因時(shí),常意味著有利等位基因?qū)α硪粋€(gè)不利等位基因的替換。因此,有必要研究等位基因的替代效應(yīng)(effect of an allele substitution)。假定我們可以把隨機(jī)挑選的等位基因A2變?yōu)锳1,中選個(gè)體的基因型可能是A1A2也可能是A2A2,頻率分別為p和q。把A1A2變?yōu)锳1A1后,基因型值從d變?yōu)閍,替換前后的效應(yīng)變化為a-d;把A2A2變?yōu)锳1A2后,基因型值從-a變?yōu)閐,替換前后的效應(yīng)變化為a+d。因此得到平均基因替換效應(yīng)的表達(dá)式。

          ?

          「基因平均效應(yīng)和替換效應(yīng)的關(guān)系:」

          ?

          上面資料來(lái)源王健康老師的PPT內(nèi)容:第8章 隨機(jī)交配群體的遺傳分析

          ?

          3. 用基因型數(shù)據(jù)計(jì)算

          3.1 基因頻率

          首先,看一下基因頻率:

          • p為:0.1693
          • q為:0.8307

          也可以根據(jù)AA,AT,TT的個(gè)數(shù),手動(dòng)計(jì)算:

          3.2 加性效應(yīng)和顯性效應(yīng)

          這里,用AA,AT,TT平均表型值計(jì)算:

          「計(jì)算的結(jié)果:」

          • m:2.316
          • a:2.316
          • d:1.804

          3.3 基因效應(yīng)和替換效應(yīng)

          注意,如果要手動(dòng)計(jì)算的替換效應(yīng)和回歸分析計(jì)算的回歸系數(shù),需要滿足哈溫平衡。這里位點(diǎn)不符合哈溫平衡,所以手動(dòng)計(jì)算的替換效應(yīng)和回歸分析的beta值有差別。

          4. 替換效應(yīng)和回歸系數(shù)等價(jià)推導(dǎo)

          下面介紹一下相關(guān)的推導(dǎo)。

          把SNP的分型轉(zhuǎn)為0-1-2的X變量,將表型數(shù)據(jù)為Y變量,那么回歸系數(shù)的公式可以推導(dǎo)為替換效應(yīng)的組成。

          上圖中,X是編碼為0-1-2的SNP,Y是每個(gè)基因型0-1-2的表型值。比如:

          如果我們對(duì)value為Y,SNP為x,計(jì)算回歸系數(shù):b = cov(X,Y)/var(X),就可以推導(dǎo)為:b = alpha,截距為:u - 2palpha

          結(jié)論:回歸系數(shù)就是替換效應(yīng)。

          5 模擬數(shù)據(jù)演示

          計(jì)算公式:

          5.1 小數(shù)據(jù)演示

          我們模擬一個(gè)符合哈溫平衡的位點(diǎn),p=0.5,q=0.5,n=12個(gè):

          計(jì)算不同分型的平均數(shù):

          • A2A2 = 10.7
          • A1A2 = 18.2
          • A1A1 = 31

          那么加性效應(yīng)和顯性效應(yīng)為:

          • m = (31+10.7)/2 = 20.85
          • a = 31-20.85 = 10.15
          • d = 18.2 -m = -2.65

          替換效應(yīng)為:a + (p - q)d = 10.15 截距為:u = 19.5 截距 = 19.5 - 20.5*10.15 = 9.35

          可以看出,計(jì)算出的回歸系數(shù)為:10.16,截距為9.33,結(jié)果基本一致。

          5.2 大數(shù)據(jù)演示

          # 假定p為0.8,q為0.2,a=10,m =30,d=5,
          # 那么分型為0的為20,分型為1的為35,分型為2的為40
          # 那么分型為0的頻率為0.64,分型為1的頻率為0.32,分型為2的頻率為0.04
          # 總模擬個(gè)數(shù)為1000,標(biāo)準(zhǔn)差為5
          rm(list=ls())
          set.seed(123)
          AA = data.frame(SNP = rep(0,640),y = rnorm(640,20,5))
          AT = data.frame(SNP = rep(1,320),y = rnorm(320,35,5))
          TT = data.frame(SNP = rep(2,40),y = rnorm(40,40,5))

          dd = rbind(AA,AT,TT)
          head(dd)
          str(dd)
          table(dd$SNP)

          mod = lm(y ~ SNP,data=dd)
          summary(mod)


          ## 手動(dòng)計(jì)算
          mu = mean(dd$y);mu
          a=10;d=5;p=0.8;q=0.2 
          beta = a + (p-q)*d;beta
          beta_0 = mu - 2*q*beta;beta_0

          回歸計(jì)算的回歸系數(shù)和截距為:

          • 截距:20.6
          • 回歸系數(shù):12.9989

          手動(dòng)計(jì)算基因的替換效應(yīng):

          • 截距為:20.61
          • 回歸系數(shù)為:13
            兩者結(jié)果完全一致。

          5. 替換效應(yīng)和育種值

          一個(gè)個(gè)體的育種值,就是他的后代群體,相對(duì)于整個(gè)親本群體的差異。比如一個(gè)個(gè)體的育種值是0.5,那就是說(shuō)他的后代會(huì)比群體的整體平均值高0.3,如果育種值是0,那就是后代的平均值和群體一致。所以,我們要選擇blup值大的個(gè)體,因?yàn)樗暮蟠鷷?huì)高于群體的平均值。

          因此,基因型A1A1、A1A2和A2A2的育種值分別為A11=2α1, A12=α1 +α2和A22=2α2 。統(tǒng)一起來(lái),各種基因型的育種值表示為:

          • A11 = 2*alpha1
          • A12 = alpha1 + alpha2
          • A22 = alpha2 注意,這里的alpha1是等位基因1的平均效應(yīng),alpha2是等位基因2的平均效應(yīng)。

          所以,這里,就可以理解為數(shù)量遺傳學(xué)的替換效應(yīng)就和GWAS分析的效應(yīng)值聯(lián)系到了一起。

          根據(jù)上面的公式,我們就可以根據(jù)每個(gè)位點(diǎn)的效應(yīng)值,計(jì)算單個(gè)SNP的育種值,加性效應(yīng)和顯性效應(yīng)。

          本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
          打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
          猜你喜歡
          類(lèi)似文章
          全基因組重測(cè)序基礎(chǔ)及高級(jí)分析知識(shí)匯總
          群體遺傳學(xué)知識(shí)點(diǎn)歸納
          polygenic risk score:多基因風(fēng)險(xiǎn)評(píng)分
          動(dòng)脈粥樣硬化性心血管病的遺傳學(xué)和基因組學(xué)研究
          【轉(zhuǎn)】使用metaCCA進(jìn)行單/多個(gè)SNP與多表型的典型相關(guān)性分析
          文獻(xiàn)&工具 | 整合GWAS和QTL預(yù)測(cè)復(fù)雜性狀的靶基因 | SMR
          更多類(lèi)似文章 >>
          生活服務(wù)
          分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
          綁定賬號(hào)成功
          后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
          如果VIP功能使用有故障,
          可點(diǎn)擊這里聯(lián)系客服!

          聯(lián)系客服