•   产品定义

          自2000年首次发布以来,人类参考基因组只覆盖了基因组的常染色质部分,留下了关键的异染色质区域未被破解。T2T联盟解决了此前未被组装的剩余8%基因组,并提供了一个完整的,含有30.55亿碱基对的人类完整基因组(T2T-CHM13),包含除Y染色体以外所有染色体的无gap组装,同时纠正了之前参考基因组中的组装错误。T2T-CHM13中新引入了近2亿个碱基对序列,包含1956个新基因。完成的区域包括所有的着丝粒卫星阵列,片段重复,以及所有染色体的短臂,解锁这些基因组的复杂区域,将为后续进行变异和功能研究提供重要的研究基础。

          这种结合PacBio HiFi、ONT ultra-long以及Hi-C等成熟测序技术,完成的高准确性、高连续性和高完整性的从端粒到端粒的基因组组装,被称为T2T(Telomere-to-Telomere)基因组。它能矫正原本基因组中组装错误,有助于对基因组中高重复序列区域或高重复结构进行深入研究,为着丝粒区域或未知高重复区域的变异特征的研究提供契机。

    注:一般情况下,T2T基因组更适合小基因组、HiFi组装后contig数目少、染色体长度较短、低重复物种

    参考基因组需求 测序个体数
     否 1

     

    测序方案

      分析内容

          T2T基因组除组装外,其它分析内容与动植物基因组构建(基因组de novo)一致。

     图1 T2T流程图

    产品优势

    依托于几百个物种的从头组装经验,基因组上能达到T2T的染色体比例得到保障

    自研软件HapHMM(隐马尔可夫模型)解决T2T基因组中的未挂载杂合序列去除的难题

      文库 测序量
     二代测序 350-500bp WGS文库  100X 
    Hi-C文库  100X 
    转录组文库  6-10G 
     三代PacBio测序  HiFi文库 30X(按cell算) 
    三代ONT测序 50-100Kb

    N50>100kb,50X(按cell算)

    每条染色体均进行精细化的端粒延伸和GAP填补

    参考基因组需求 测序个体数
     否 1

     

  •   T2T基因组

          获得物种T2T基因组,能够填补此前未被组装到的基因组片段,能够修正历史版本的组装错误,同时能够解锁基因组复杂区域。物种完整的T2T基因组,意味着能够检测到很多新的基因和遗传变异信息。

     图1 T2T基因组上contig分布

  • QT2T基因组是否所有染色体都能达到端粒到端粒?

          T2T是高准确性、高连续性、高完整性的端粒到端粒的高质量基因组,需根据实际情况,不保证每条染色体都能无GAP,端粒也可能组装不出来,常规情况下可以保证至少有一条染色体达到T2T水平,但在实际情况中,往往会有多条甚至大多数染色体能达到该水平。

    Q怎么判断染色体端粒、着丝粒是否组装出?

    端粒:鉴定端粒特征碱基重复数

    着丝粒:在基因组序列层面,当组装的染色上无CAP时,初步认为着丝粒组装成功;

    实验层面进行着丝粒鉴定:FISH+ChIP -seq

    1. Xu M, Guo L, Gu S, et al. TGS-GapCloser: A fast and accurate gap closer for large genomes with low coverage of error-prone long reads. Gigascience. 2020;9(9):giaa094. doi:10.1093/gigascience/giaa094
    2. Nurk S, Koren S, Rhie A, et al. The complete sequence of a human genome. Science. 2022;376(6588):44-53. doi:10.1126/-science.abj6987
    3. .Chen T, Cullen RM, Godwin M. Hidden Markov model using Dirichlet process for de-identification. J Biomed Inform. 2015;58 Suppl(Suppl):S60-S66. doi:10.1016/j.jbi.2015.09.004
    4. Hou X, Wang D, Cheng Z, Wang Y, Jiao Y. A near-complete assembly of an Arabidopsis thaliana genome. Mol Plant.2022;15(8):1247-1250. doi:10.1016/j.molp.2022.05.014
    5. Deng Y, Liu S, Zhang Y, et al. A telomere-to-telomere gap-free reference genome of watermelon and its mutation library provide important resources for gene discovery and breeding. Mol Plant. 2022;15(8):1268-1284. doi:10.1016/j.molp.2022.06.010
    6. Altemose N, Logsdon GA, Bzikadze AV, et al. Complete genomic and epigenetic maps of human centromeres. Science.2022;376(6588):eabl4178. doi:10.1126/science.abl4178
    7. Aganezov S, Yan SM, Soto DC, et al. A complete reference genome improves analysis of human genetic variation. Science.2022;376(6588):eabl3533. doi:10.1126/science.abl3533
    8. Vollger MR, Guitart X, Dishuck PC, et al. Segmental duplications and their variation in a complete human genome. Science.2022;376(6588):eabj6965.doi:10.1126/science.abj6965