, J$ v; p0 v) f* U* j
$ B8 r* _, I+ }, g" F 前言
/ S: _5 J2 C) y 扇贝因其肉质鲜嫩,含有大量可消化的蛋白质、必需氨基酸和丰富的矿物质已经成为人们餐桌上必不可少的一种美味佳肴。为了提高养殖扇贝的产量及抗病性,近年来中国海洋大学联合其他合作单位通过人工选育,培育出了海大金扇贝和獐子岛红2个优良品种,二者在生长和生产性状上具有良好的表现。 6 W% M& ]& m6 S9 p3 P" C$ k* t
. b# \! p6 U l% m' m
然而,目前对虾夷扇贝2个优良品种的群体分化、基因组连锁不平衡模式以及选择特征的分析还缺乏全面的研究。人工培育的品种与野生品种在基因组层面上究竟存在哪些不同呢?或许本篇文章可以为你解答一部分疑惑。
* b N. g% q3 H' R; _" k% b 论文名称:Genomic differentiation and selection signatures of two elite varieties of Yesso scallop Mizuhopecten yessoensis
4 V4 W8 H0 }# A: p8 R' z6 E3 n 发表期刊:Aquaculture
5 Y0 d" N/ o1 w- g 影响因子:4.242
4 P- M1 K' Z6 `$ Z. n, ?, R 作者单位:中国海洋大学 8 q6 T' M, O0 Y6 a. n1 L
涉及的欧易生物服务产品:全基因组重测序、简化基因组2b-RAD
4 ]# y- y: b& @$ k) Y
5 R. W- k: s4 F# g* y( K, e 研究背景 + n3 l4 ]8 T& `3 W) w
培育新的优良品种除了具有较高的市场价值外,还为优良性状的遗传分析提供了宝贵的资源。近年来,得益于高通量测序技术的成本下降,一些新的经济有效的基因分型方法已被用于识别这些新品种中与经济重要性状相关的基因,然而对于人工选择品种的多样性和分化程度及优良经济重要性状相关的选择性标签,目前仍存在一定的认识差距。 * T& S9 u) M, \+ F
因此,本研究对大连市漳子岛的两个人工品种“海大金扇贝”(HD),“獐子岛红扇贝”(ZH)和一个参考群体(DL)进行全基因组重测序分析。本研究旨在利用高密度SNP基因分型数据,评估两个品种间的遗传变异和分化,并检测其基因组选择特征。本文研究结果将为现有扇贝基因组资源提供有用的补充,助力虾夷扇贝的遗传改良和分子生物学研究。
' ^- `! R4 f9 a$ ~% Z, A$ R3 K 研究内容
: b1 t. [. |6 r& s% Z, {4 V 本研究对30份(18个参考种群(DL)采集自獐子岛沿海多个地点的自然种群,6个海大金扇贝”(HD),6个“獐子岛红扇贝”(ZH))虾夷扇贝进行了全基因组重测序建库在X-ten平台上进行测序,信息分析时整合82个个体(49个HD,33个ZH)的2b-RAD简化基因组测序结果对进组水平进行了分析,鉴定出与性状相关的候选基因。
8 w2 D W1 u, x: P5 A: D 研究思路
1 i! h4 X/ I3 i, D9 G* I" } % g; l+ e( z9 l P+ U. m+ _$ D
研究结果
$ F, ~# `, W& e! t: z' u" Z9 E 一、突变体发现和注释 ! {5 ~5 X/ S2 \( I1 }
1、质控后共获得9534749个SNP,平均深度为20x(7418855个/个体)(Table1) & d% n5 |3 H# ~& L9 y+ g6 z1 Y' {
2、19条染色体共筛选得到885306个SNP(91.1%):所有SNP均匀分布在染色体上,平均每Kb大约有10个SNP且SNP数目与染色体总长度存在较高相关系数。(Table1)(图a)
' |2 [+ `4 V: D. o4 m7 ^ O0 R4 ]; Z/ m " D$ s2 X& a+ Y
d! n5 ^* I' }( L
3、核苷酸替换模式比例情况:50.96%被划分为转换(A/G和C/T),49.04%被划分为颠换(A/C、A/T、C/G和G/T)
L$ L3 ?3 z- {# y) u0 S" ~6 x 4、52.8%的SNPs位于基因间区,47.2%位于包括外显子、内含子、UTR在内的基因区。值得注意的是,在外显子区鉴定出的287,046个SNPs位于21,382个不同的基因上,平均每个基因有13个SNPs。可以认为是开发SNP阵列的首选(Table2)。 Z" [9 I+ v3 w# N, _4 t* x
0 P3 V+ d. x0 o (a)SNP distributions on the 19 chromosomes of Yesso scallop. The number of SNPs per 200 bp in the consensus data was shown as color index.
1 ~% J% y9 a/ l 二、遗传多样性
$ g' \5 d8 c. w" Z L' v# c3 [5 ` R 1、多态标记比例(94.70%)、观测杂合度(Ho = 0.3897)和预期杂合度(He = 0.3687)显示,DL群体的遗传多样性最高,选择群体的遗传多样性略低。 8 d3 b6 w7 b6 c; S- F, F/ |, T
2、与DL群体相比,两个人工选择品种的多态性SNPs约少18%(图b)。
, `) a- {+ ?6 W
' q6 a0 [% z& U! i/ I' b! F5 N (b)Upset plot shows the number of unique SNPs per group (individual dots below chart) and overlapping SNPs subsets among two or three groups. ! M" ~7 L0 ?& X# t
3、DL组(π = 2.25 × 10−5)的遗传多样性大于两个人工选择组(π = 1.76 × 10−5),HD组(π = 1.76 × 10−5)与ZH组(π = 1.98 × 10−5)差异不大(图c)。 + y- L5 A" ?( ^# L& }) V/ o
" P, W4 S- A+ H1 N
7 s+ ^0 `6 |5 P" u (c)Nucleotide diversity (π) and population divergence (Fst) across three groups. The values in each circle represented nucleotide diversity for this group, and the values on each line indicated population divergence between the groups and the p-value for the Fst estimated were in brackets.
* D% M/ [% I5 y/ x/ M1 d 4、各群体的近交系水平均较低,HD和ZH的近交系水平略高于对照群体(Table3)。 & ~8 q8 U7 d3 B. C/ N: k
7 Y1 c! a `1 g! V, v 三、种群分化和连锁不平衡 # n0 v' X7 O5 d- N1 P- f8 U$ `
1、种群分化分析显示,以Fst值为基础的组间种群分化程度中等,其中ZH组与HD组间的Fst值最高(0.0608)(图c)。 ) S7 F* ?: g+ S% N/ {7 ]6 a
2、全基因组连锁不平衡(LD)表明,DL组相关系数均值(r2)在3 kb左右迅速下降,HD和ZH组下降相对较慢。 - s# a3 q& [+ t _* B
) i% }) X9 q' A" ?( k# k5 O
3、在>10 kb的距离,人工选择品种的平均两两相关系数(r2)高于对照群体,这表明人工选择在整个基因组中保留了相对较大的LD块(图d)。
$ [" v( m$ c5 ] 7 f6 M( G2 M+ T S1 c* ~1 W
(d) Decay of linkage disequilibrium (r2) with physical distance (kilobases) in each group. Each line was a smoothed fit of the pairwise linkage disequilibrium against distance per population.
1 z2 W* h p" n# `3 j0 F; Y' W 4、主成分分析(PCA)结果显示,各群体中的个体紧密聚在一起,与其他群体明显分离,表明品种内部具有较高的同质性(图2a)。第1主成分(PC1)解释了品种间总变异的10.18%,将HD和ZH从DL群体中分离出来。 9 U' ^$ r( N' E, D& |0 _
5、邻接树分析也将样本划分为3个主分支,显示出两个人工品种(HD、ZH)之间的亲缘关系较近(图2b),与PCA分析结果一致。
* d0 V* E* @0 `, P) y 6、根据最优亚群数(K = 2)确定了2个祖先群,得分高于0.80的红群由12个个体组成,均为DL群体。在12个人工品种中,有7个个体表现出混合血统,DL得分低于0.2分,说明新品种对原始血统的代表性减弱。在K = 3时,有三个不同的成分与实际总体基本一致。在K = 3,4时的结果显示,新的种群可以分为两个明显的亚群,具有不同的祖先,在参考种群中似乎有一些分化(图2c)。 & [' w! h* @2 K; ^$ p0 G
7、整合了82个人工品种的2bRAD数据进行数据分析,发现HD和ZH的14号染色体和18号染色体上有连续的高度分化的选择区域。HD和ZH品种中共检测到1079个和966个被选择的基因;在HD群体中识别了溶血磷脂酰胆碱酰基转移酶1(LPCAT1),LPCAT1已被报道为参与内收肌类胡萝卜素积累的候选基因;ZH品种中,筛选到与免疫应答和应激耐受相关的候选基因,如TNF受体相关因子(TRAF)、磷脂酶D1 (PLD1)、羰基还原酶[NADPH] 1 (Cbr1)和钙/钙调素依赖性蛋白激酶IV (CAMK4)。 n6 L, S! z" c3 J
8 E" U& V* [) p0 s: Q# ]; p: l
Fig. 2. Population relationship and structure of the three Yesso scallop groups. (a) Principal component analysis (PCA). The first and the second principal components explained 10.18% and 7.46% of the genetic diversity, respectively. (b) A neighbor-joining tree constructed using SNPs data. (c) Admixture the individual cluster values corresponding to each K value. The x-axis showed different samples. The y-axis quantified the membership probability of samples belonging to different groups. Colors in each row represented structural components. 9 c; a! ?# g/ ? W) D
四、人工选择品种的选择特征
# X$ _+ q" W1 ~) Z: t( E 1、应用综合遗传分化(Fst)和核苷酸多样性(π)的统计结果的复合测量来识别选定的基因组区域。Fst和π分数分布比值均为前5%的基因组区域被视为潜在的选择窗口,重叠窗口被合并以进行进一步分析(图3b和图4b)。来自两种方法重叠区域的基因具有更强的选择信号。发现HD和ZH的14号染色体和18号染色体上有连续的高度分化的选择区域。HD和ZH品种中共检测到1079个和966个被选择的基因(图3a和图4a)。 - X3 j \% f, D! B7 G, t
2、在HD群体中识别了溶血磷脂酰胆碱酰基转移酶1(LPCAT1)(图3c),LPCAT1已被报道为参与内收肌类胡萝卜素积累的候选基因;ZH品种中,筛选到与免疫应答和应激耐受相关的候选基因,如泛素羧基末端水解酶CYLD(CYLD)、肌醇1,4,5-三磷酸受体1型(ITPR1)和β-己糖胺酶亚基β(HEXB)。(图4c)
4 v$ Q2 k! {# B8 o , }2 _8 q5 A& J( j7 R; s
Fig. 3. Manhattan plots for pairwise index of Fst values and candidate genes exploration and GO enrichment analysis. (a) The values of Fst between HD and DL were plotted against the position on each of the 19 chromosomes. The dashed horizontal line represents the significant threshold for identifying putatively selected regions (Fst = 0.2494, p-value <0.05). (b) Identification of the domestication selective sweeps. The green dots indicated the selective sweeps. (c) Go enrichment analysis of candidate genes under selection. Y-axis label represented GO term,and X-axis label represented rich factor (rich factor = amount of genes enriched in the GO term / amount of all genes in background gene set). Size and color of the bubble represented amount of selected genes enriched in GO term and enrichment significance,respectively. (For interpretation of the references to color in this figure legend,the reader is referred to the web version of this article.) " C5 z6 v' d9 S
r5 p# ?- X# C) n, K- x% ^
Fig. 4. Manhattan plots for pairwise index of Fst values and candidate genes exploration and GO enrichment analysis. (a) The values of Fst between ZH and DL were plotted against the position on each of the 19 chromosomes. The dashed horizontal line represented the significant threshold for identifying putatively selected regions (Fst = 0.2550, p-value <0.05). (b) Identification of the domestication selective sweeps. The green dots indicated the selective sweeps. (c) Go enrichment analysis of candidate genes under selection in ZH. (For interpretation of the references to color in this figure legend, the reader is referred to the web version of this article.) / B2 n6 d q& H$ J
欢迎百度搜索欧易生物——访问欧易生物官网——了解全基因组重测序、简化基因组2b-RAD技术
0 J5 Y; D2 G* j4 ] 结论
& {/ d3 Y& c6 K. Q& H 本研究采用全基因组重测序方法,对2个人工选择品种(HD和ZH)和1个自然群体(DL) 3个群体的遗传多样性、LD范围和群体结构进行了研究。另外,本文整合了82个2bRAD数据对全基因组进行了扫描,并确定了与优良品种表型变化相关的候选基因。整体概述了虾夷扇贝品种的群体结构和选择特征,这些基因组变异数据集的获得将有助于扇贝育种的实际应用,获得的候选选择基因将有助于探索虾夷扇贝有利性状的基因组基础。 ; r* C% g9 _" c- ^! h
End本文系青岛欧易原创
* N H8 U* w7 E0 f* n+ r, Z
2 R) O! _/ g4 _' X: ^9 |$ G3 M/ n3 }; N7 E, Y% K; V. x
" _7 Y# ? u" m& A5 R5 U7 a/ _ W6 `, ~0 `* y/ ~/ Y
|