天堂网亚洲,天天操天天搞,91视频高清,菠萝蜜视频在线观看入口,美女视频性感美女视频,95丝袜美女视频国产,超高清美女视频图片

宏基因組測序帶給了我們什么?

2022/1/13 16:05:25

關(guān)于宏基因組測序

直接對提取的全宏基因組DNA建立隨機(jī)小片段文庫,能夠獲取更多的序列信息。通過組裝、ORFs預(yù)測與注釋,通過各種大型公共數(shù)據(jù)庫進(jìn)行相應(yīng)注釋,高精度解析微生物群落結(jié)構(gòu)與功能,包括特色的各種抗性基因、可移動元件以及氮循環(huán)基因網(wǎng)絡(luò)分析等。

宏基因組測序的優(yōu)點(diǎn)

超深度視野,更精確分類定位;

真實(shí)可靠的功能分析;

適合需要更加精確解析微生物群落結(jié)構(gòu)與功能的微生態(tài)學(xué)分析項(xiàng)目。

今天為大家?guī)硪黄榻B宏基因組測序的綜述文章,我們從以下6個(gè)方面來解讀。

目錄

1. 摘要

2. 背景

3. 宏基因組學(xué)為我們帶來了什么?

4. 宏基因組測序的性能評價(jià)

5. 宏基因組測序的基因豐度

6. 創(chuàng)新與未來方向

01 摘要

宏基因組鳥槍法測序的出現(xiàn)徹底改變了我們檢測和描述復(fù)雜微生物群落多樣性和功能的能力。在這篇綜述中,作者強(qiáng)調(diào)了使用宏基因組測序的優(yōu)勢、使用目前的分析工具可以得出的結(jié)論的廣度以及宏基因組數(shù)據(jù)分析面臨的挑戰(zhàn)。在未來,技術(shù)和方法的改進(jìn)和創(chuàng)新會使測序成本降低,并且使用多種技術(shù)平臺的數(shù)據(jù)集成方式將讓人們更好地利用宏基因組數(shù)據(jù),不僅能夠描述出復(fù)雜的微生物群,而且能夠?qū)崿F(xiàn)健康、農(nóng)業(yè)和環(huán)境的可持續(xù)發(fā)展。

02 背景

微生物學(xué)的工具:顯微鏡、培養(yǎng)組學(xué)和基因工程等技術(shù)使研究人員能夠?qū)Σ糠钟袡C(jī)體進(jìn)行觀察、培養(yǎng)和實(shí)驗(yàn),揭示它們的生物學(xué)功能、遺傳和進(jìn)化能力等。微生物幾乎遍布在地球上的每一個(gè)角落,它們對生態(tài)系統(tǒng)和宿主健康有著巨大的影響。高通量測序技術(shù)的出現(xiàn)將生物學(xué)數(shù)據(jù)與潛在的遺傳關(guān)系相結(jié)合,迅速提高了人們對微生物群落物種多樣性的理解。盡管宏基因組測序讓我們得以一窺復(fù)雜的微生物群落,但這些數(shù)據(jù)本身可能是不完整的、具有局限性的。因此,當(dāng)科學(xué)研究需要使用這項(xiàng)技術(shù)時(shí),對宏基因組測序的客觀判斷是非常重要的。

由于宏基因組鳥槍測序的成本和分析難度等問題,16S rRNA測序被廣泛用于微生物群落確定組成成分的分析中。16S rRNA基因普遍存在于細(xì)菌中;而且通常情況下,這個(gè)基因在進(jìn)化上是穩(wěn)定的,因此它可以成為鑒定分類的重要遺傳標(biāo)記。16S測序可以研究群落的物種組成、物種間的進(jìn)化關(guān)系以及群落的多樣性,16S測序得到的序列很多注釋不到種水平,而宏基因組測序在16S測序分析的基礎(chǔ)上還可以進(jìn)行基因和功能層面的深入研究(GO、Pathway等),同時(shí)可以鑒定微生物到種水平甚至菌株水平。

這篇綜述主要集中闡述宏基因組測序的優(yōu)勢,并概述使用當(dāng)前可用的分析工具得出的結(jié)論的廣度,例如可以更好地分辨跨門和功能微生物和菌株,同時(shí)強(qiáng)調(diào)了宏基因數(shù)據(jù)分析的挑戰(zhàn)(圖1)。這些主要挑戰(zhàn)包括功能注釋,因?yàn)榕c模式生物相比,人們?nèi)狈Νh(huán)境細(xì)菌的功能數(shù)據(jù)庫,以及在不同環(huán)境樣本中進(jìn)行序列組裝的技術(shù)挑戰(zhàn)。

AllImg_2.jpg

圖1

03 宏基因組學(xué)為我們帶來了什么?

基因組信息庫

許多早期的宏基因組研究使用比對來參考基因組來評估樣本的組成和功能。給定合適的基因、編碼區(qū)或參考基因組等信息,宏基因組數(shù)據(jù)就可以使用比對軟件根據(jù)參考信息進(jìn)行分析。然而,直到今天,許多環(huán)境宏基因組樣本仍然缺乏合適的有代表性的參考基因組。微生物培養(yǎng)組學(xué)的進(jìn)步使我們可以發(fā)現(xiàn)和培養(yǎng)許多以前未知或不可培養(yǎng)的微生物,因此對現(xiàn)有的微生物基因知識庫進(jìn)行不斷的擴(kuò)充、更新的很有必要的。

宏基因組測序的組裝方法

重疊組裝(Overlap assembly methods)是為了Sanger測序而發(fā)明的,它基于OLC(Overlap-Layout-Consensus, 先重疊后擴(kuò)展)是最初被應(yīng)用于DNA序列組裝的方法。這種組裝方式必須對每個(gè)read進(jìn)行成對比較,適合長序列組裝,運(yùn)行依賴的數(shù)據(jù)結(jié)構(gòu)需要消耗大量的內(nèi)存,且運(yùn)行速度比較慢,錯誤率高不太適合下一代測序(NGS)。而基于DBG(De Brujin Graph)的組裝算法,內(nèi)存消耗相對較低,運(yùn)算速度快,且準(zhǔn)確率高。整個(gè)組裝過程包括:序列k-mer化,對需要測序的片段等大小拆分,即將reads 逐個(gè)堿基切分為長度為K的子序列;de Brujin圖構(gòu)建,de Brujin圖是一種有向圖,將k-mers得到的子序列作為圖的節(jié)點(diǎn),如果兩個(gè)節(jié)點(diǎn)有 K-1個(gè)共同重疊子集,就把兩個(gè)節(jié)點(diǎn)連接在一起,這樣一定程度上已經(jīng)能夠展現(xiàn)出序列的順序信息;圖結(jié)構(gòu)簡化,去除低頻和低覆蓋率的k-mer,將小的重復(fù)對解開,讓每個(gè)節(jié)點(diǎn)的入度(penetration)和出度(outdegree)都為1,將相似性較高的k-mers合并,也就是bubbles合并成單鏈;contigs拆分,通過read的配對末端(pair-end)和環(huán)化配對(mate-pair)信息去除一些環(huán)結(jié)構(gòu),最后把一些無法合并的分叉結(jié)構(gòu)再次拆分成多個(gè)contigs;scaffold構(gòu)建,通過contig兩端的pair的序列信息,將多個(gè)contig連接成scaffold,同時(shí)將contig之間的GAP填充;最終把多個(gè)scaffold組裝成無GAP的基因組序列。

盡管組裝的目的是重建整個(gè)基因組,但宏基因組組裝后輸出是高度碎片化的,需要額外的分析來確定屬于同一基因組的contig集合,將 contigs 按照物種水平進(jìn)行分組歸類??梢詫⒔M裝得到的片段與已知物種的參考基因組進(jìn)行比對,根據(jù)同源性進(jìn)行歸類。然而當(dāng)大多數(shù)微生物的基因組信息無法獲取時(shí),通常會根據(jù)核酸組成信息、豐度信息、GC含量、測序覆蓋深度等信息進(jìn)行binning。

宏基因組測序組裝的質(zhì)量評估

組裝指標(biāo)的好壞直接影響著整個(gè)基因組的質(zhì)量,評估基因組組裝結(jié)果,contig N50和scaffold N50是指標(biāo),即contig/scaffold N50。一般來說,contig/scaffoldN50越長,表示組裝結(jié)果越好。除此之外還可以驗(yàn)證reads對基因組的覆蓋情況,用于評估組裝的完整性以及測序的均勻性。較高的mapping rate(90%以上)以及coverage(95%以上)認(rèn)為組裝結(jié)果和reads有比較好的一致性。通過全長BAC序列,可以通過與組裝結(jié)果的比對,對組裝結(jié)果的正確性進(jìn)行驗(yàn)證,從BAC序列和scaffold是否具有較好的一致性來判斷組裝質(zhì)量。即根據(jù)廣泛存在于大量真核生物中的保守蛋白家族集合(248個(gè)core gene庫),對組裝得到基因組進(jìn)行評估,評估組裝基因組中的core gene的準(zhǔn)確性和完整性??梢酝ㄟ^該物種和同源物種cegma的比例,判斷保守基因組裝情況。

宿主與病毒、真菌的遺傳信息

微生物群落中除了存在細(xì)菌DNA外,還會有病毒、真菌和宿主的DNA,動物和植物系統(tǒng)中的宿主DNA也與細(xì)菌、病毒和真核共生體DNA一起進(jìn)行了測序。大多數(shù)情況下,宿主DNA在分析之前會被篩選出去,這一步驟在人類宏基因組研究中尤為重要。在某些類型的微生物群落中,例如口腔和皮膚微生物群落的測序數(shù)據(jù)中,會有很大一部分?jǐn)?shù)據(jù)被去除(最高可達(dá)90%)。越來越多的研究將人類基因數(shù)據(jù)與微生物組成和功能聯(lián)系起來進(jìn)行聯(lián)合全基因組關(guān)聯(lián)分析,但目前還沒有利用從宏基因組樣本中的人類基因數(shù)據(jù)來實(shí)現(xiàn)這一目的研究。

宿主相關(guān)表型

宏基因組數(shù)據(jù)分析塑造了我們對微生物組和寄主表型(如健康情況、生長過程和作物生產(chǎn)力)之間關(guān)系的理解。例如,在Young(Teddy)的一項(xiàng)糖尿病環(huán)境決定因素的研究中,作者利用來自783名兒童的近11,000份樣本,希望能夠確定出可以預(yù)測1型糖尿?。═1D)發(fā)病的腸道微生物群落在組成或功能方面的特異性。研究發(fā)現(xiàn),與T1D發(fā)病相關(guān)的微生物在功能上相似,但在分類上不同,母乳喂養(yǎng)停止得越早,腸道微生物群成熟得越快;此外,已經(jīng)有超過8個(gè)關(guān)于結(jié)直腸癌的宏基因組研究,對宏基因組數(shù)據(jù)進(jìn)行分析比較可以發(fā)現(xiàn)具有重要功能的關(guān)鍵基因。

04 宏基因組測序的性能評價(jià)

宏基因組測序的主要優(yōu)勢是能夠?qū)ξ⑸锶郝溥M(jìn)行功能分析。這通常需要將數(shù)據(jù)與已知的或重新組裝的基因進(jìn)行比對,以獲得基因豐度并推斷功能豐度,而與宿主無關(guān)。換句話說,與分類學(xué)分析不同的是,這些方法在某些情況下不依賴于標(biāo)記基因,甚至不依賴于組裝。在進(jìn)行功能分析時(shí)需要注意,因?yàn)榄h(huán)境微生物群落中高達(dá)50%的基因缺乏功能注釋。例如,作為人類微生物群計(jì)劃(Human Microbiome Project)的一部分有一項(xiàng)利用16S rRNA和宏基因組鳥槍測序來描述300個(gè)志愿者幾個(gè)身體部位微生物群落組成的研究,最早試圖從功能上描述人類腸道微生物群,最終的結(jié)果是:盡管微生物組成存在巨大差異,但人體各個(gè)部位的功能圖譜是保守的。這一結(jié)論在很大程度上是由于當(dāng)時(shí)擁有注釋的基因大部分存在于所有微生物的保守核心基因。所以,需要通過分析各個(gè)身體部位之間核心基因和功能之間的差異,以及了解基因在功能上被注釋到了什么程度,才能很好地修正分析結(jié)果。

05 宏基因組測序的基因豐度

分析宏基因組數(shù)據(jù)需要仔細(xì)考慮基因組組裝和豐度計(jì)算的問題。目前有兩種方式可計(jì)算宏基因組基因的豐度,一種是基于比對的一系列主流比對軟件,另一種是不比對快速估計(jì)基因豐度的軟件,這類軟件可以直接計(jì)算出原始的Counts值和標(biāo)準(zhǔn)化的TPM值,此外由于是基于非比對,計(jì)算的速度得到很大的提升。

宏基因組中的物種分類,一般用OTU (operational taxonomic unit), 即可操作分類單元來表示。在一般情況下,原核生物的OUT使用16S rDNA來衡量,真核生物的OUT使用18s rDNA來衡量。但選擇16S/18S rDNA鑒定物種,存在以下幾個(gè)問題:1)rDNA之間的平行轉(zhuǎn)移會干擾鑒定的可靠性;2)在單個(gè)細(xì)菌中,16r DNA可能存在序列不同的幾個(gè)拷貝,干擾OTU數(shù)目估計(jì)的準(zhǔn)確性。所以,其他備選的標(biāo)記基因,比如單拷貝的看家基因是菌種鑒定標(biāo)記的選擇。除了這些技術(shù)問題外,單獨(dú)對微生物群落進(jìn)行宏基因組鳥槍測序時(shí),微生物生態(tài)系統(tǒng)的許多方面都可能被忽略。

06 創(chuàng)新與未來方向

未來十年,隨著DNA、RNA測序技術(shù)和普及程度的提高,微生物群落的宏基因組測序分析將發(fā)生巨大的變化。長片段測序成本降低、測序技術(shù)提高,將會改善基因組組裝的效果。由于由短片段測序數(shù)據(jù)組裝出的基因組可能與實(shí)際基因有很大的差異性,并且參考基因組的缺少也對為組裝帶來難度,因此長片段測序的發(fā)展將對提高宏基因組組裝質(zhì)量大有裨益。宏基因組學(xué)應(yīng)用場景的增加,特別是隨著數(shù)據(jù)平臺類型的增長,將會給數(shù)據(jù)存儲和數(shù)據(jù)報(bào)告方面帶來新的挑戰(zhàn)。未來數(shù)據(jù)庫的大小將需要從數(shù)據(jù)壓縮、高速搜索和內(nèi)存效率等幾個(gè)方面解決;而數(shù)據(jù)報(bào)告和提交的標(biāo)準(zhǔn)協(xié)議,特別是在提供什么信息和元數(shù)據(jù)方面是十分重要的。

盡管有這些預(yù)期的改進(jìn),如何為微生物組內(nèi)的大量基因進(jìn)行功能注釋對于理解微生物基因表型關(guān)聯(lián)機(jī)制是必要的。最近發(fā)現(xiàn),Eggerthella lenta 中多巴胺脫氫酶(DahD)基因的單個(gè)氨基酸殘基的差異改變了治療帕金森病的藥物L(fēng)-dopa在一組患者的微生物群落樣本中是否保持活性。為了使研究內(nèi)容不僅僅局限于微生物群落的特征,理解整個(gè)表型背后的機(jī)制,對基因功能的準(zhǔn)確理解是非常必要的。對DNA修飾的鑒定,例如使用單分子實(shí)時(shí)(SMRT)測序獲得的甲基化修飾圖譜,可以揭示自然界微生物群落中質(zhì)粒遷移的有趣現(xiàn)象。隨著技術(shù)的創(chuàng)新人們將不斷揭示出微生物群落中生物的相互作用、功能角色、進(jìn)化軌跡以及生態(tài)地位等有趣的事實(shí),這些會讓人們更好地理解生物群落,以實(shí)現(xiàn)健康、農(nóng)業(yè)或環(huán)境可持續(xù)發(fā)展。

參考文獻(xiàn):

doi/10.1146/annurev-micro-012520-072314

免責(zé)申明 ChemicalBook平臺所發(fā)布的新聞資訊只作為知識提供,僅供各位業(yè)內(nèi)人士參考和交流,不對其精確性及完整性做出保證。您不應(yīng) 以此取代自己的獨(dú)立判斷,因此任何信息所生之風(fēng)險(xiǎn)應(yīng)自行承擔(dān),與ChemicalBook無關(guān)。文章中涉及所有內(nèi)容,包括但不限于文字、圖片等等。如有侵權(quán),請聯(lián)系我們進(jìn)行處理!
閱讀量:1174 0

歡迎您瀏覽更多關(guān)于宏基因組測序的相關(guān)新聞資訊信息