|
8 @" u7 m( l4 V& {# m6 R7 n 2020年5月,中国水产科学研究院黄海水产研究所陈四清研究员团队与北京百迈客生物科技有限公司合作完成了首个超高质量的绿鳍马面鲀基因组,相关研究成果发表在知名期刊Molecular Ecology Resources上。本次研究基于纳米孔测序技术(Nanopore)和染色体构象捕获技术(Hi-C)完成的基因组仅包含242个Contigs,Contig N50高达22.46 Mb,并将99.44%序列挂载到20条染色体上,实现了海洋鱼类基因组组装质量质的飞跃! * A# J! V+ b& Q$ z
点击下载文献原文
) e2 c) q) r. ^5 X' q
5 @, J& J6 r Y2 h$ q! q% ~ 占比地球容量71%的海洋中蕴藏着丰富的生物资源,而海洋生物体内多糖和蛋白含量较高,以及部分海洋生物极易死亡腐败从而引起DNA的降解,给高纯度、完整的基因组DNA的获取带来了极大的困难。而海洋生物通常与陆生动植物相比更为复杂,组装拼接的难度更大。本次研究使用Nanopore测序技术突破了这些瓶颈,完成了海洋鱼类超高质量的基因组组装! , u& B4 f: ]3 b0 o3 f
研究中使用104X Nanopore测序数据进行基因组组装,通过Canu、WTDBG等多款软件分别进行组装,选取最优的组装结果(主要从基因组大小,contig N50,组装完整性,组装准确性等方面评估)进行后续研究优化。研究者最终使用WTDBG软件组的基因组版本结合Hi-C技术的进一步优化,组装完成474.31 Mb基因组,并将99.44%的基因组挂载至20条染色体上, ContigN50提升至22.46 Mb,且最长的Contig达到32.32 Mb! 5 L6 h1 r6 Q$ N) S
图1 基因组组装流程众所周知,Contig N50是衡量基因组组装质量好坏的一个重要指标,一定程度上来说,ContigN50值越高表示组装的质量越好。与已有鲀形目基因组比较,绿鳍马面鲀基因组组装的ContigN50超过了同样使用三代测序进行组装的黄鳍东方鲀(Takifugu flavidus)的5倍,更是超过了翻车鱼(Mola mola)的1000倍! , l4 F6 i6 K' z1 L1 \
表1 鲀形目基因组比较而与近年的一些鱼类基因组ContigN50相比,绿鳍马面鲀基因组组装的连续性同样也是表现超群。从表2中不难发现,近年来鱼类基因组ContigN50水平基本在Kb与Mb之间徘徊,而本次使用Nanopore组装的绿鳍马面鲀直接上升了一个数量级,完成了连续性超强的优质基因组。 $ q5 [6 k$ W$ A, l% U
表2 近年已发表的鱼类基因组优秀的基因组不能只看连续性,完整性也同样重要。研究者分别用Racon及Pilon进行两轮及三轮纠错来对WTDBG的组装的基因组进行polish,并对纠错前后基因组的完整性进行了多个方面的评估。
8 i% S2 s$ I' G 01、二代reads比对分析
2 Q6 Y7 J4 k" L; g+ `4 l" S3 a 利用bwa软件将二代数据与参考基因组进行比对。结果显示,二代reads双端比对效率为97.41%,表明三代组装基因组完整性较好。
]: d s' f! x* C u/ p 02、核心基因完整性评估 ( C. H' z# H$ f
CEGMA v2.5数据库包含了真核生物458个保守的核心基因。使用CEGMA v2.5来评估最终基因组组装的完整性。在最终版的基因组中,通过序列相似性(Identity > 70%)比对,共找到了458个核心基因中的442个(96.51%)。而在CEGMA v2.5所包含的更加保守的248个序列中,91.13%可以在组装的基因组找到。
& |% P7 X$ R; G4 u, K 03、BUSCO评估
+ q6 A; l- n3 o* h+ X BUSCO v2中actinopterygii数据库包含了真核生物中的4584个保守的核心基因。我们使用BUSCO v2.0软件来评估基因组组装的完整性。在我们组装的基因中,共找到4,324个完整的BUSCO基因,其中单拷贝的4,213个,多拷贝的有111个;不完整的BUSCO基因有62个;未找到的有198个,BUSCO评估基因组完整度为94.33%(Complete BUSCOs/Total BUSCOs)。 5 o: N; {9 p- u9 c& |
评估结果均显示完整度在94%以上,说明了基因组的整体组装质量非常优异,将对后续的下游分析极为有利,具有无限的开发潜力。
# X" O0 x3 s7 J( y5 b( v5 a : R2 v' m9 q% M& Y3 C" {" t; y
总结
' p1 n/ k/ K% u$ w 本次案例中的海洋经济鱼——绿鳍马面鲀通过Nanopore平台进行了超长读长的基因组测序,使海洋生物组装指标(contig N50)超越22 Mb!成为了目前为止我们所知的海洋鱼类N50最高的基因组!同时评估结果也表明,组装的准确度与完整性也非常高。 1 M- t: K) D, s& z
百迈客ONT平台超强连续性基因组研究展示(部分)8 U2 v9 S8 \! {& J
: \! A% G2 x2 a i 结合往期以及如上表给大家展示的组装数据不难看出,在一定组装深度的情况下,Nanopore技术能带来高水平的基因组,甚至还会出现新的惊喜!无论是动物植物还是微生物、无论是基因组转录组还是宏基因、无论是旧数据的更新还是高难度物种的破译,Nanopore都能出彩表现~
D2 _9 u- O( N* F- @: I! L 截至目前,百迈客Nanopore平台已经完成了近400种物种的DNA建库测序工作,拥有大量的项目经验!无论是技术还是项目经验上,我们都实力过硬!期待越来越多可喜的结果交付到各位老师的手中~ 6 \4 e5 x3 T/ A+ h; I2 _6 p: T
NANOPORE 官方认证证书
( j" X8 x7 I) _4 W * \7 C* ?- N0 H; l. s3 z+ R4 y
本文出自“百迈客生物”,原文链接: & o4 j) a3 f: R
8 i3 k1 ^, q# K% x6 Q0 @- ^) M/ k# E
转载请联系作者。
$ v+ d: _5 T+ u' T8 @
9 s/ ~4 y! u' L: S8 R- J7 U' h+ k' Z6 k6 K6 g; M9 o' b
3 _8 N$ F7 l6 L1 T& f, t6 N4 T# M0 D( A
|