發(fā)表在Nature期刊1月份的文章:Seven technologies to watch in 2022對(duì)2022年可能撼動(dòng)科學(xué)發(fā)展的工具進(jìn)行了第五次年度總結(jié),其中包括了從基因編輯到蛋白質(zhì)結(jié)構(gòu)確定再到量子計(jì)算的技術(shù)[1]
人類共有基因組序列GRCh38于2013年首次發(fā)布,是用來(lái)繪制序列的支架,但它們較短,長(zhǎng)度不足以明確地繪制出高度重復(fù)的基因組序列。2019年端粒到端粒 (T2T) 聯(lián)盟成立以來(lái)解決了大約十分之一未知的人類基因組。去年5月,該聯(lián)盟報(bào)告了人類基因組的第一個(gè)端到端序列,為人類共有基因組序列 GRCh38 添加了近2億個(gè)新堿基對(duì),并撰寫了人類基因組的最后一章。T2T聯(lián)盟是如何完成這些工作的呢?答案是美國(guó)太平洋生物科學(xué)公司和英國(guó)牛津納米孔技術(shù)公司開發(fā)的長(zhǎng)讀長(zhǎng)測(cè)序技術(shù),這種技術(shù)可以在一次讀取中對(duì)數(shù)萬(wàn)甚至數(shù)十萬(wàn)個(gè)堿基進(jìn)行測(cè)序。到2020年T2T團(tuán)隊(duì)首次重組單獨(dú)的X染色體和8號(hào)染色體時(shí),太平洋生物科學(xué)公司的測(cè)序已經(jīng)使T2T科學(xué)家可以檢測(cè)到長(zhǎng)段重復(fù)序列中微小變化的程度。這些微妙的“指紋”使長(zhǎng)段重復(fù)的染色體片段易于處理,基因組的其余部分也能迅速歸位。納米孔技術(shù)公司幫助T2T捕獲了許多調(diào)節(jié)基因表達(dá)的 DNA修飾,即“表觀遺傳標(biāo)簽”。T2T解決的基因組來(lái)自包含兩組相同染色體的細(xì)胞系。正常二倍體人類基因組中每個(gè)染色體都有兩個(gè)版本,研究人員現(xiàn)在正在研究“基因分型”策略,可以將每個(gè)序列分配給對(duì)應(yīng)的染色體拷貝。這項(xiàng)二倍體組裝工作是與T2T的合作伙伴組織——人類泛基因組參考聯(lián)盟合作進(jìn)行的,該組織希望根據(jù)來(lái)自世界各地的數(shù)百名捐贈(zèng)者制作更具代表性的基因組圖譜。未來(lái)有望利用這些完整基因組的組裝能力為地球上的每個(gè)脊椎動(dòng)物物種生成完整的序列。圖1 端粒到端粒聯(lián)盟正在對(duì)整個(gè)染色體進(jìn)行測(cè)序
(來(lái)源:Adrian T. Sumner/SPL)
蛋白的結(jié)構(gòu)決定了功能,但蛋白的結(jié)構(gòu)并不容易確定。在過(guò)去兩年里,實(shí)驗(yàn)和計(jì)算方面的進(jìn)步使研究人員能夠以前所未有的速度和分辨率確定蛋白質(zhì)的結(jié)構(gòu)。AlphaFold2結(jié)構(gòu)預(yù)測(cè)算法由英國(guó)DeepMind公司開發(fā),它依靠“深度學(xué)習(xí)”策略從氨基酸序列推斷蛋白質(zhì)的形狀。自2021年7月公開發(fā)布以來(lái),AlphaFold2已應(yīng)用于蛋白質(zhì)組研究,來(lái)確定在人類和20種模式生物中表達(dá)的所有蛋白質(zhì)的結(jié)構(gòu),以及Swiss-Prot數(shù)據(jù)庫(kù)中的近440000種蛋白質(zhì),大大增加了可獲得高置信度建模數(shù)據(jù)的蛋白質(zhì)數(shù)量。AlphaFold算法也證明了其解析多鏈蛋白質(zhì)復(fù)合物的能力。同時(shí),冷凍電鏡(cryo-EM)的發(fā)展使研究人員能夠通過(guò)實(shí)驗(yàn)方法處理即使是最具挑戰(zhàn)性的蛋白質(zhì)和復(fù)合物。Cryo-EM使用電子束掃描快速冷凍的分子,生成多個(gè)方向的蛋白質(zhì)圖像,然后可以通過(guò)計(jì)算重新組裝成3D結(jié)構(gòu)。2020年,cryo-EM硬件和軟件的改進(jìn)使兩個(gè)團(tuán)隊(duì)能夠生成分辨率低于1.5埃的結(jié)構(gòu),捕獲單個(gè)原子的位置。AlphaFold2現(xiàn)在被視為對(duì)冷凍電鏡等實(shí)驗(yàn)方法的補(bǔ)充,其計(jì)算模型可以幫助數(shù)據(jù)分析和重建。冷凍電鏡可以生成目前無(wú)法進(jìn)行計(jì)算預(yù)測(cè)的結(jié)果。另一相關(guān)技術(shù)冷凍電子斷層攝影術(shù)(cryo-ET)可以捕捉冷凍細(xì)胞薄片中的天然蛋白質(zhì)結(jié)構(gòu),這也相當(dāng)振奮人心。圖2 RBD-ACE2-B0AT1復(fù)合物的冷凍電鏡圖[2]
原子很小,但它們可以被誘導(dǎo)進(jìn)入直徑在一微米或更大的高度激發(fā)狀態(tài)。通過(guò)控制數(shù)百個(gè)原子排列陣列的激發(fā),物理學(xué)家已經(jīng)證明他們可以解決具有挑戰(zhàn)性的物理問(wèn)題,進(jìn)而將傳統(tǒng)計(jì)算機(jī)推向極限。量子計(jì)算機(jī)以量子比特的形式處理數(shù)據(jù)。量子比特通過(guò)量子物理中的糾纏現(xiàn)象可以在一定距離內(nèi)相互影響。這些量子比特可以極大地提高計(jì)算能力。多個(gè)團(tuán)隊(duì)已經(jīng)成功地將單個(gè)離子作為量子比特,但它們的電荷使其難以在高密度下組裝。法國(guó)國(guó)家科學(xué)研究中心的Antoine Browaeys和美國(guó)哈佛大學(xué)的Mikhail Lukin等物理學(xué)家正在探索使用光學(xué)鑷子在緊密排列的2D和3D陣列中精確定位不帶電的原子,然后應(yīng)用激光將這些粒子激發(fā)成大直徑的“里德堡原子”,并使它們與附近的原子糾纏在一起。里德堡原子系統(tǒng)是單獨(dú)可控的,它們的相互作用可以打開和關(guān)閉,這反過(guò)來(lái)又賦予了它們可編程性。這種方法在短短幾年的時(shí)間里獲得了相當(dāng)大的發(fā)展勢(shì)頭,技術(shù)進(jìn)步提高了里德堡原子陣列的穩(wěn)定性和性能,并從幾十個(gè)量子比特快速擴(kuò)展到幾百個(gè)量子位。早期的應(yīng)用主要集中在已提出的問(wèn)題上,例如預(yù)測(cè)材料的性能,但其用途十分廣泛,不僅限于此。該領(lǐng)域的先驅(qū)們已經(jīng)成立了一些公司,正在開發(fā)實(shí)驗(yàn)室用的里德堡原子陣列系統(tǒng),這種量子模擬器可能在一兩年內(nèi)就可以商用。這項(xiàng)工作為量子計(jì)算機(jī)在包括經(jīng)濟(jì)、物流和加密領(lǐng)域(如通信加密)的更廣泛應(yīng)用鋪平道路。圖3 量子模擬觀測(cè)聲波的產(chǎn)生[3]
CRISPR-Cas9技術(shù)傾向于使基因失活而不是基因修復(fù)。這是因?yàn)榧?xì)胞對(duì)Cas9酶靶向基因組序列產(chǎn)生雙鏈切割的修復(fù)并不精確。CRISPR-Cas9修復(fù)經(jīng)常因小的插入或缺失而變得混亂。哈佛大學(xué)的化學(xué)生物學(xué)家David Liu指出,人類大多數(shù)遺傳疾病需要的是基因修正而不是基因失活。他們團(tuán)隊(duì)已經(jīng)開發(fā)出兩種方法來(lái)做到基因修正。兩種方法都利用了CRISPR的精確定位,但在該位點(diǎn)不能行使切割DNA功能的Cas9的變體。第一種稱為單堿基編輯,將催化受損形式的Cas9(Dcas9或Cas9 nikase)與另一種酶(DNA修飾酶)結(jié)合,幫助一種核苷酸轉(zhuǎn)化為另一種核苷酸,但目前只能使用此方法進(jìn)行某些特定堿基到堿基的更改(參見 Nature https://doi.org/hc2t;2016))。該團(tuán)隊(duì)最新開發(fā)了引導(dǎo)編輯,將Cas9與逆轉(zhuǎn)錄酶聯(lián)系起來(lái),并使用一種修改的引導(dǎo)RNA,該RNA可以將所需編輯的內(nèi)容整合到基因組序列中[4]。通過(guò)多階段的生化過(guò)程,這些成分將引導(dǎo)RNA復(fù)制到最終取代目標(biāo)基因組序列的DNA中。重要的是,這兩種方法都只切割一條DNA鏈,這對(duì)細(xì)胞來(lái)說(shuō)是一種更安全且破壞性更小的過(guò)程。單堿基編輯在2016年首次被報(bào)道,現(xiàn)在已經(jīng)進(jìn)入臨床。引導(dǎo)編輯也在不斷升級(jí)換代。圖4 引導(dǎo)編輯示意圖[4]
基于核酸的藥物雖然具有臨床價(jià)值,但它們可應(yīng)用的組織仍受到很大限制。大多數(shù)治療或是局部給藥,或是對(duì)從患者身上采集的細(xì)胞進(jìn)行離體操作再移植回患者體內(nèi)。腺相關(guān)病毒是許多基因療法的首選載體,動(dòng)物研究表明,仔細(xì)選擇合適的病毒,結(jié)合組織特異性的基因啟動(dòng)子,可以實(shí)現(xiàn)特定器官的高效遞送。但病毒有時(shí)難以大規(guī)模生產(chǎn),還會(huì)引發(fā)免疫反應(yīng),破壞療效或產(chǎn)生不良事件。脂質(zhì)納米粒是一種非病毒替代品,過(guò)去幾年發(fā)表的幾項(xiàng)研究強(qiáng)調(diào)了調(diào)控其特異性的潛力。美國(guó)德克薩斯大學(xué)生物化學(xué)家Daniel Siegwart等人開發(fā)的選擇性器官靶向(SORT)方法能幫助快速生成和和篩選脂質(zhì)納米粒,找出能有效靶向肺或脾臟等組織細(xì)胞的納米粒。許多團(tuán)隊(duì)也在探索如何利用細(xì)胞特異性抗體等蛋白質(zhì)成分幫助靶向過(guò)程。Beam Therapeutics和Intellia等公司在骨髓中靶向血液和免疫細(xì)胞前體的臨床前進(jìn)展振奮人心,這兩家公司都使用特殊設(shè)計(jì)的脂質(zhì)納米粒,它們的成功靶向?qū)⑹够颊弑苊猱?dāng)前包括化療在內(nèi)的體外基因療法所涉及的痛苦過(guò)程。圖5 負(fù)載mRNA脂質(zhì)納米粒的制備、優(yōu)化和肝靶向遞送示意圖[5]
單細(xì)胞組學(xué)的發(fā)展使研究人員現(xiàn)在可以常規(guī)地從單個(gè)細(xì)胞中獲得遺傳、轉(zhuǎn)錄組、表觀遺傳和蛋白質(zhì)組學(xué)的見解,但是這種技術(shù)也由于將細(xì)胞從其原始環(huán)境中剝離出來(lái)而遺漏關(guān)鍵信息。空間轉(zhuǎn)錄組學(xué)領(lǐng)域的大爆發(fā)源于2016年,瑞典皇家理工學(xué)院的Joakim Lundeberg團(tuán)隊(duì)制備了帶有條形碼的寡核苷酸(RNA或DNA的短鏈)載玻片,它們可以從完整的組織切片中捕獲信使RNA,這樣每個(gè)轉(zhuǎn)錄本就可以根據(jù)其條形碼定位到樣本中的特定位置。現(xiàn)在有多種商業(yè)系統(tǒng)可供使用,包括10x Genomics公司的Visium空間基因表達(dá)平臺(tái),該平臺(tái)建立在Lundeberg的技術(shù)之上。學(xué)術(shù)團(tuán)體也在繼續(xù)開發(fā)新方法,以更好的深度和空間分辨率繪制基因表達(dá)圖譜。研究人員正在他們的空間圖譜中疊加組學(xué)數(shù)據(jù),例如耶魯大學(xué)Rong Fan開發(fā)了采用微流體系統(tǒng)的DBiT-seq 16平臺(tái),可以同時(shí)為數(shù)千個(gè)mRNA轉(zhuǎn)錄樣本和數(shù)百個(gè)以標(biāo)記寡核苷酸抗體作為標(biāo)簽的蛋白質(zhì)生成條形碼,這可以更準(zhǔn)確地評(píng)估細(xì)胞基因表達(dá)如何影響蛋白質(zhì)的產(chǎn)生和活性。他們還利用此平臺(tái)來(lái)研究免疫細(xì)胞激活等過(guò)程。包括Visium平臺(tái)和Nanostring的GeoMx系統(tǒng)的商業(yè)系統(tǒng)還可以在從多種蛋白質(zhì)中獲取空間數(shù)據(jù)的同時(shí)獲取轉(zhuǎn)錄組學(xué)信息。Lundeberg團(tuán)隊(duì)改進(jìn)空間轉(zhuǎn)錄組學(xué)方法,來(lái)同時(shí)捕獲DNA序列數(shù)據(jù),進(jìn)而繪制腫瘤發(fā)生背后的時(shí)空事件。Rong Fan的團(tuán)隊(duì)展示了組織樣本中染色質(zhì)修飾的空間定位,用來(lái)揭示影響發(fā)育、分化和細(xì)胞間通訊等過(guò)程的細(xì)胞基因調(diào)控。
圖6 空間轉(zhuǎn)錄組學(xué)的應(yīng)用[6]
CRISPR-Cas系統(tǒng)能夠精確切割特定核酸序列,這種能力來(lái)源于細(xì)菌抵抗病毒感染的“免疫系統(tǒng)”作用,因此該系統(tǒng)對(duì)病毒診斷也有適用性。但并不是所有Cas酶的作用都相同。Cas9是基于CRISPR基因組操作的首選酶,但基于CRISPR的診斷大多使用Cas13的靶向RNA分子家族,該家族于2016年由分子生物學(xué)家張鋒及其團(tuán)隊(duì)發(fā)現(xiàn)。Cas13利用向?qū)?/span>RNA通過(guò)堿基配對(duì)識(shí)別RNA靶標(biāo),并激活核糖核酸酶活性,可通過(guò)報(bào)告RNA作為診斷工具使用。Cas13作為病毒診斷工具是因?yàn)樗恢皇乔懈钕驅(qū)NA靶向的RNA,它還對(duì)附近的其他RNA分子進(jìn)行“附帶切割”。許多基于Cas13的診斷方法使用一種將熒光標(biāo)簽連接到抑制熒光猝滅分子上的報(bào)告RNA。當(dāng)Cas13在識(shí)別病毒RNA且被激活時(shí),會(huì)切割報(bào)告基因并從猝滅基團(tuán)釋放熒光標(biāo)簽,產(chǎn)生可檢測(cè)的信號(hào)。一些病毒釋放出強(qiáng)的信號(hào),可以在不擴(kuò)增的情況下被檢測(cè),從而簡(jiǎn)化了即時(shí)診斷。去年1月,就有研究人員展示了一種用于檢測(cè)無(wú)擴(kuò)增SARS-CoV-2的基于鼻拭子的快速CRISPR-Cas13檢測(cè)方法。RNA 擴(kuò)增可以提高對(duì)微量病毒序列的敏感性,麻省理工學(xué)院-哈佛大學(xué)博德研究所的遺傳學(xué)家Sabeti和她的同事開發(fā)了一種微流體系統(tǒng),僅使用來(lái)自幾微升樣本的擴(kuò)增遺傳物質(zhì),就可以同時(shí)篩選多種病原體。她們還開發(fā)出了可以同時(shí)檢測(cè)超過(guò)169種人類病毒的基于CRISPR的工具。包括靶向DNA的Cas12等其他Cas酶可以充實(shí)診斷工具箱,檢測(cè)更廣泛的病原體,甚至可以有效診斷其他非傳染性疾病。圖7 基于CRISPR的診斷系統(tǒng)示意圖
(來(lái)源:https://innovativegenomics.org)
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。