背景[1-3]
基因組重測(cè)序是對(duì)已知基因組序列的物種進(jìn)行不同個(gè)體的基因組測(cè)序,并在此基礎(chǔ)上對(duì)個(gè)體或群體進(jìn)行差異性分析。
全基因組重測(cè)序的個(gè)體,通過序列比對(duì),可以找到大量的單核苷酸多態(tài)性位點(diǎn)(SNP),插入缺失位點(diǎn)(InDel,Insertion/Deletion)、結(jié)構(gòu)變異位點(diǎn)(SV,Structure Variation)位點(diǎn)和拷貝數(shù)變異位點(diǎn)(CNV,copy number variation)。SBC可以協(xié)助客戶,通過生物信息手段,分析不同個(gè)體基因組間的結(jié)構(gòu)差異,同時(shí)完成注釋。
技術(shù)路線:提取基因組DNA,利用Covaris進(jìn)行隨機(jī)打斷,電泳回收所需長(zhǎng)度的DNA片段(0.2~5Kb),加上接頭,進(jìn)行cluster制備(Solexa)或E-PCR(SOLiD),最后利用Paired-End(Solexa)或者M(jìn)ate-Pair(SOLiD)的方法對(duì)插入片段進(jìn)行重測(cè)序。
基因組重測(cè)序
生物信息分析流程:
1.?dāng)?shù)據(jù)量產(chǎn)出
總堿基數(shù)量、Totally mapped reads、Uniquely mapped reads統(tǒng)計(jì),測(cè)序深度分析。
2.一致性序列組裝
與參考基因組序列(Reference genome sequence)的比對(duì)分析,利用貝葉斯統(tǒng)計(jì)模型檢測(cè)出每個(gè)堿基位點(diǎn)的可能性基因型,并組裝出該個(gè)體基因組的一致序列。
3.SNP檢測(cè)及在基因組中的分布
提取全基因組中所有多態(tài)性位點(diǎn),結(jié)合質(zhì)量值、測(cè)序深度、重復(fù)性等因素作進(jìn)一步的過濾篩選,最終得到可信度高的SNP數(shù)據(jù)集。并根據(jù)參考基因組序列對(duì)檢測(cè)到的變異進(jìn)行注釋。
4.InDel檢測(cè)及在基因組的分布
在進(jìn)行mapping的過程中,進(jìn)行容Gap的比對(duì)并檢測(cè)可信的Short InDel。在檢測(cè)過程中,Gap的長(zhǎng)度為1~5個(gè)堿基。
5.Structure Variation檢測(cè)及在基因組中的分布
目前SBC能夠檢測(cè)到的結(jié)構(gòu)變異類型主要有:插入、缺失、復(fù)制、倒位、易位等。根據(jù)測(cè)序個(gè)體序列與參考基因組序列比對(duì)分析結(jié)果,檢測(cè)全基因組水平的結(jié)構(gòu)變異并對(duì)檢測(cè)到的變異進(jìn)進(jìn)行注釋。
應(yīng)用[4][5]
用于應(yīng)用全基因組重測(cè)序技術(shù)篩查原發(fā)性肌張力障礙的致病基因研究
應(yīng)用全基因組重測(cè)序技術(shù)對(duì)原發(fā)性肌張力障礙病患者進(jìn)行全基因組重測(cè)序,結(jié)合生物信息學(xué)技術(shù),篩查出可能與原發(fā)性肌張力表型患者密切相關(guān)的基因突變位點(diǎn),從而發(fā)現(xiàn)新的基因或突變,有助于我們對(duì)該疾病進(jìn)行正確的分子診斷以及提供更好的遺傳咨詢信息。
目的:(1)通過全基因組重測(cè)序技術(shù)篩查出可能與原發(fā)性肌張力表型患者密切相關(guān)的基因突變位點(diǎn),為了該病家系患者的遺傳咨詢和臨床診斷提供依據(jù)。(2)探討全基因組重測(cè)序技術(shù)在罕見疾病致病基因篩查應(yīng)用中的可行性,為該技術(shù)的臨床應(yīng)用提供新的信息。
方法:收集原發(fā)性肌張力患者及健康對(duì)照者外周血標(biāo)本及臨床資料,提取受試者基因組DNA,選取1例具有典型原發(fā)性肌張力表型患者的DNA和100例健康對(duì)照者DNA分別構(gòu)建患者全基因組測(cè)序文庫(kù)和健康對(duì)照者全基因組測(cè)序文庫(kù),并進(jìn)行高通量測(cè)序。下機(jī)獲得原始數(shù)據(jù),經(jīng)過初步數(shù)據(jù)過濾后與標(biāo)準(zhǔn)基因組序列比對(duì),獲得原發(fā)性肌張力表型患者及對(duì)照組基因變異信息;通過比較原發(fā)性肌張力表型患者及對(duì)照組基因變異信息,并結(jié)合生物信息學(xué)技術(shù),篩查可能與原發(fā)性肌張力表型患者密切相關(guān)的基因突變位點(diǎn)。
結(jié)果:(1)通過全基因組重測(cè)序一共得到240G bp的數(shù)據(jù),其中患者的數(shù)據(jù)產(chǎn)出為127.90G bp,原始數(shù)據(jù)測(cè)序深度為45X,有效測(cè)序深度為40.30X,基因組覆蓋比例為98.90%,SNP數(shù)量為3,602,141,Indel數(shù)量為58,127,CNV數(shù)量為831,SV數(shù)量為8,431;健康對(duì)照者的數(shù)據(jù)產(chǎn)出為112.91G bp,原始數(shù)據(jù)測(cè)序深度為40X,有效測(cè)序深度為35.70X,基因組覆蓋比例為99.50%,SNP數(shù)量為3,550,305,Indel數(shù)量為558,038,CNV數(shù)量為824,SV數(shù)量為8222。
(2)SNP公共數(shù)據(jù)庫(kù)過濾并將病人與健康對(duì)照對(duì)比后,得到96個(gè)突變位點(diǎn),突變基因包括錯(cuò)義突變,蛋白質(zhì)提前終止,移碼突變,內(nèi)含子剪切異常等多種類型。
結(jié)論:(1)在臨床應(yīng)用全基因組重測(cè)序工作中,患者結(jié)合健康人群的對(duì)照分析,有利于濾過未明確臨床意義的基因組變異位點(diǎn)。(2)發(fā)現(xiàn)ANO3(N294H)突變與疾病的表型密切相關(guān),可能是中國(guó)原發(fā)性肌張力障礙病患者的致病突變之一。
參考文獻(xiàn)
[1]Whole-genome sequencing is more powerful than whole-exome sequencing for detecting exome variants.[J].Belkadi Aziz,Bolze Alexandre,Itan Yuval,Cobat Aurélie,Vincent Quentin B,Antipenko Alexander,Shang Lei,Boisson Bertrand,Casanova Jean-Laurent,Abel Laurent.Proceedings of the National Academy of Sciences of the United States of America.2015(17)
[2]Mutations in GNAL:A Novel Cause of Craniocervical Dystonia[J].Kishore R.Kumar,Katja Lohmann,Ikuo Masuho,Ryosuke Miyamoto,Andreas Ferbert,Thora Lohnau,Meike Kasten,Johann Hagenah,Norbert Brüggemann,Julia Graf,Alexander Münchau,Vladimir S.Kostic,Carolyn M.Sue,Aloysius R.Domingo,Raymond L.Rosales,Lilian V.Lee,Karen Freimann,Ana Westenberger,Youhei Mukai,Toshitaka Kawarai,Ryuji Kaji,Christine Klein,Kirill A.Martemyanov,Alexander Schmidt.JAMA Neurology.2014(4)
[3]Rare sequence variants in ANO3 and GNAL in a primary torsion dystonia series and controls[J].Michael Zech,Nadine Gross,Angela Jochim,Florian Castrop,Maria Kaffe,Christian Dresel,Peter Lichtner,Annette Peters,Christian Gieger,Thomas Meitinger,Bernhard Haslinger,Juliane Winkelmann.Mov Disord..2014(1)
[4]Mutation screening of GNAL gene in patients with primary dystonia from Northeast China[J].Jing Miao.Parkinsonism and Related Disorders.2013(10)
[5]穆匯.應(yīng)用全基因組重測(cè)序技術(shù)篩查原發(fā)性肌張力障礙的致病基因[D].廣西師范大學(xué),2018.