•   产品定义

            全基因组重测序是指使用高通量测序技术对已有参考基因组序列的某一物种的个体或者群体进行全基因组DNA测序,进而获得大量的遗传变异信息,包括单核苷酸多态性(SNP)、插入缺失(InDel)、结构变异(SV)和拷贝数变异(CNV)等。

            基于检测到的变异能够全方位解析群体的遗传变异程度、遗传结构,推测种群的历史动态,追溯种群选择、驯化及进化事件,挖掘适应性进化相关基因等,从分子层面深入研究该物种的进化历程。同时也能快速发现与动植物重要性状相关的遗传变异,并进一步应用于分子育种中,缩短育种周期。

     方案一 

     

     

      文库 测序量

     

     

     

     二代测序

     

     

     

    350-500bp WGS文库

    SNPs/InDels:每个个体 ≥ 10X

                              SVs:每个个体 ≥ 20X

                              CNVs:每个个体 ≥ 30X

    分析内容

     图3.1泛基因组的构建

     图3.2泛基因组的组成

     图1 全基因组重测序分析流程图

    测序方案

     

    参考基因组需求 测序个体数
    ≥50

     

     方案二

     

     

      文库 测序量

    三代PacBio 测序

     HiFi文库

    每个个体 ≥ 20X

    产品优势

    数据精准:严格质量控制流程,保证结果准确度

    变异类型丰富:可以检测多类型的SNPs、InDels、SVs和CNVs等多种变异类型

    高密度标记:检测到广覆盖与全基因组范围的SNP信息,同时可检测低频SNP

    分析内容全面,周期短

  • 群体结构“三剑客”

            通过构建群体的系统进化树、群体主成分分析、和Structure群体结构分析,研究群体样本之间的亲缘进化关系,三种分析方法的结果可以相互验证。

    连锁不平衡分析与LD单体型

            连锁不平衡(linkage disequilibrium,LD)分析使用r2计算两个标记间的连锁不平衡度。不同的物种、同一物种的不同群体因受到重组、选择、群体类型等的影响,其LD变化情况不同,一般情况下我们会统计LD值衰减到一半的距离。

     图2 连锁不平衡分析与LD单体型

     图2 连锁不平衡分析与LD单体型

     


    种群历史动态分析

            通过基因组碱基变异情况对物种种群历史动态进行分析,能够揭示群体进化过程中的种群大小变化的趋势,有效群体大小的剧烈波动,可以揭示生存环境的变化,其一般与较大的地质活动、温度等环境变化相关。

    图3有效种群历史大小分析

     


    选择性清除分析

    选择在物种的遗传变异形成过程中有巨大的贡献,其中搭便车效应会对种群水平的分化产生剧烈的影响:由于较强的选择效应,使得一个突变位点相邻DNA上的核苷酸之间的差异下降或消除(selective sweep)。通过分析大量的比较基因组学数据集和大量的SNP集,我们可以确定在野生种到栽培种/地方种的过程中,以及在不同的环境情况下,哪些区域的多态性发生了巨大的改变,检测驯化或环境适应性相关的候选基因,这些基因往往与进化相关的性状也存在关联。在数据层面,选择性清除区域表现为亚群内多态性降低,亚群间差异大,LD大。

    图4选择清除分析结果展示

     


    遗传多样性分析

    某一物种不同个体在DNA序列上有某种程度的不同,这些序列水平上的差异形成了该物种丰富多彩的遗传多样性。遗传多样性作为生物进化以及新物种形成的基础,有助于提升物种应对环境变化的能力,在人类的健康、农作物等的育种策略、濒危动物保护、动植物环境适应性进化、种群大小变化等方面发挥着重要的作用。

    图5 群体间遗传多样性指数

     


  • Q变异检测测序深度如何选择?

            当测序深度为10X以上时,个体对基因组覆盖度高于95%,能检测到的个体SNP数高于90%。鉴于对较大群体(如GWAS项目)进行SNP检测时低深度数据可以进行缺失推断(个体间存在弥补效应),可提高群体覆盖度,因此建议测序深度不低于5X;而当个体或群体较小时,建议测序深度不低于10X。

            如果对CNV和SV进行检测,需要相应的增大测序深度以SV:≥20x,CNV:≥30x为宜。

     

    Q测序个体与参考基因组比对,比对率低的原因有哪些?

            参考基因组组装质量差、测序物种与参考基因组物种的亲缘关系较远、测序样本的外源污染、测序样本自身变异较大等。

    1. Zhao YP, Fan G, Yin PP, et al. Resequencing 545 ginkgo genomes across the world reveals the evolutionary history of the living fossil. Nat Commun. 2019;10(1):4201. Published 2019 Sep 13. doi:10.1038/s41467-019-12133-5
    2. Slatko BE, Gardner AF, Ausubel FM. Overview of Next-Generation Sequencing Technologies. Curr Protoc Mol Biol. 2018;122(1):e59. doi:10.1002/cpmb.59
    3. Bourgeois YXC, Warren BH. An overview of current population genomics methods for the analysis of whole-genome resequencing data in eukaryotes. Mol Ecol. 2021;30(23):6036-6071. doi:10.1111/mec.15989
    4. Yu Y, Guan J, Xu Y, et al. Population-scale peach genome analyses unravel selection patterns and biochemical basis underlying fruit flavor. Nat Commun. 2021;12(1):3604. Published 2021 Jun 14. doi:10.1038/s41467-021-23879-2
    5. Ren G, Zhang X, Li Y, et al. Large-scale whole-genome resequencing unravels the domestication history of Cannabis sativa. Sci Adv. 2021;7(29):eabg2286. Published 2021 Jul 16. doi:10.1126/sciadv.abg2286
    6. Kosugi S, Momozawa Y, Liu X, Terao C, Kubo M, Kamatani Y. Comprehensive evaluation of structural variation detection algorithms for whole genome sequencing. Genome Biol. 2019;20(1):117. Published 2019 Jun 3. doi:10.1186/s13059-019-1720-5
    7. Zhou Z, Jiang Y, Wang Z, et al. Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean. Nat Biotechnol. 2015;33(4):408-414. doi:10.1038/nbt.3096
    8. Pujolar JM, Blom MPK, Reeve AH, et al. The formation of avian montane diversity across barriers and along elevational gradients. Nat Commun. 2022;13(1):268. Published 2022 Jan 12. doi:10.1038/s41467-021-27858-5
    9. Vidal EA, Moyano TC, Bustos BI, et al. Whole Genome Sequence, Variant Discovery and Annotation in Mapuche-Huilliche Native South Americans. Sci Rep. 2019;9(1):2132. Published 2019 Feb 14. doi:10.1038/s41598-019-39391-z
    10. Frantz LAF, Bradley DG, Larson G, Orlando L. Animal domestication in the era of ancient genomics. Nat Rev Genet. 2020;21(8):449-460. doi:10.1038/s41576-020-0225-0
    11. Li M, Tian S, Jin L, et al. Genomic analyses identify distinct patterns of selection in domesticated pigs and Tibetan wild boars. Nat Genet. 2013;45(12):1431-1438. doi:10.1038/ng.2811
    12. Ellegren H, Galtier N. Determinants of genetic diversity. Nat Rev Genet. 2016;17(7):422-433. doi:10.1038/nrg.2016.58
    13. Chen N, Cai Y, Chen Q, et al. Whole-genome resequencing reveals world-wide ancestry and adaptive introgression events of domesticated cattle in East Asia. Nat Commun. 2018;9(1):2337. Published 2018 Jun 14. doi:10.1038/s41467-018-04737-0