

-
首页
-
科技服务
- 基因组构建
- 动植物基因组
- T2T基因组
- 泛基因组
- 真菌基因组
- 细菌基因组
- 线粒体基因组
- 重测序测序分析
- 动植物全基因组重测序
- 外源片段插入检测
- 转录组测序分析
- 二代有参转录组
- 二代无参转录组
- 关联分析与育种
- 性状关联分析
- 基因组选择育种
-
资源中心
- GenomeSearch
- 技术分享
- 送样建议
- 引物设计
-
新闻资讯
-
关于万摩
- 公司简介
- 项目成果
-
加入万摩


-
首页
-
科技服务
- 基因组构建
- 动植物基因组
- T2T基因组
- 泛基因组
- 真菌基因组
- 细菌基因组
- 线粒体基因组
- 重测序测序分析
- 动植物全基因组重测序
- 外源片段插入检测
- 转录组测序分析
- 二代有参转录组
- 二代无参转录组
- 关联分析与育种
- 性状关联分析
- 基因组选择育种
-
资源中心
- GenomeSearch
- 技术分享
- 送样建议
- 引物设计
-
新闻资讯
-
关于万摩
- 公司简介
- 项目成果
-
加入万摩
外源片段插入检测
-
产品定义
外源序列的插入大多呈现出随机整合的表现,而整合的随机性会导致外源基因表达的不可预测性和表型的不稳定。因此转基因成分鉴定是转基因动植物生物安全性评价的必要条件,包括外源序列的插入位点、插入序列的特征、插入位点侧翼序列等方面。
基于全基因组重测序数据对外源片段进行检测,能够更加简单、快捷的检测外源序列的插入与否,并更加准确、直观的提供外源序列(包括目标序列,及目标序列以外的其他序列如载体骨架序列)的精确插入位点、插入方向、插入拷贝数、侧翼序列、以及插入位点与周边区域内基因功能等信息,并同时会对外源序列的一致性及重测序数据的准确性进行排查。
分析内容
图3.2泛基因组的组成
图1 外源插入检测流程图
测序方案
参考基因组需求 测序个体数 是 1 产品优势
方案一
方案二
文库 测序量 二代测序
350-500bp WGS文库 每个个体30X
文库 测序量 三代PacBio测序
HiFi文库 每个个体30X
方案三
文库 测序量 三代ONT测序
30-50Kb文库 每个个体30X
-
组装序列与外源序列一致性
插入片段及侧翼序列组装与外源序列的共线性分析,直观展示组装片段与外源插入序列的一致性,及侧翼序列位置。
表1 外源序列与物种参考基因组同源性评估结果展示
外源序列同源性评估
对外源序列与野生型参考基因组的同源性进行分析,较高的同源性区域会导致reads错误比对,或者多重比对,进而影响后续对插入位点的判断。
表1 基因组组装和结构注释结果统计
外源序列reads覆盖深度分布
对reads在外源序列上的覆盖深度(蓝色柱状)和全基因组平均测序深度(红色虚线)进行展示,从覆盖度和覆盖深度两个维度对外源序列插入的片段区域和插入的拷贝数进行直观的展示。
图1 外源序列测序reads覆盖展示
图2 组装序列与外源序列一致性评估
插入位点reads覆盖情况展示
依托自主研发的全新的reads比对可视化展示工具,直观、友好地辅助展示多种外源片段插入方式,插入区域reads覆盖情况、直观展示外源序列插入的具体位置。
图3 示例1:外源序列反向、单拷贝的插入到基因组序列中,无reads跨过插入位点
插入位点附近基因信息展示
图7.6群体间遗传多样性指数
Query id
Target id
Identity
(%)
Align length
(bp)
Qstart
Qend
Tstart
Tend
E-value
Score
Foreign
reference
99.64
563
262
824
16,260,237
16,259,676
0.00e+00
1,027.0
注:A图为外源序列几乎无reads覆盖;B图为部分外源序列有reads覆盖;C图为整个外源序列均被reads覆盖。
图4示例2:插入位点有reads跨过
图5示例3:部分外源序列插入且有reads跨过插入区域
图6 示例4:AB、CD、EF分布为genome上的三个片段,gh为外源相应位置的片段,根据测序覆盖深度,和reads比对跨越、reads覆盖深度等情况,推测转化体在该区域处的实际序列应为如下所示:AB-CD-gh-CD-gh-CD-EF,CD-gh这一单元重复的次数未知。插入区域有成对reads正常跨过,显示有部分细胞未转入成功,不含有外源序列。
插入位点区域上下1kb涉及基因信息展示,从已有基因组基因信息方面初步了解插入造成的影响。
Chrom
T-DNA
insertion site start
T-DNA
insertion
site end
Depth
Insertion site
GeneDetail
refGene
Distance
to ATG
gene name
gene
description
1
7,582,926
7,582,931
446.83
Exon
AT1G21610
--
--
Wound-responsive
family protein
3 17,755,158
17,755,170
27.65
Upstream
AT3G43120
dist=312
--
Auxin-responsive
protein-like protein
1 30,489,038
30,489,102
453.46
Intergenic
AT1G75380
dist=7112
BBD1
Bifunctional
nuclease 1
1 30,489,038
30,489,102
453.46
Intergenic
AT1G75390
dist=3135
BZIP44
bZIP transcription
factor 44
1 4,517,383
4,517,389
84.86
Exon
AT1G13210
--
ALA11
Probable
phospholipid-transporting ATPase 11
3 16,973,169
16,973,176
53.02
Downstream
AT3G42153
dist=35
--
Glycosyl hydrolase
9B9 protein
1 19,802,963
19,802,964
17
Downstream
AT1G47813
dist=1418
--
T2E6.9
4 2,954,811
2,954,812
44.5
check
AT4G05320
--
UBQ10
Polyubiquitin 10
5 28,032,449
28,032,450
44.5
Exon
AT5G63520
--
--
F-box/LRR-repeat
protein At5g63520
5 7,796,864
7,796,865
44.5
Upstream
AT5G23150
dist=38
HUA2
ENHANCER OF AG-4 protein 2
插入位点侧翼序列展示
图7 插入位点侧翼测序展示
直观可视化展示插入区域(红色标记)前后2,000bp的侧翼序列,便于对插入区域侧翼序列进行直接获取,以及后续引物设计验证等分析
-
Q进行外源片段检测需要的数据信息有哪些?
a.野生型参考基因组;
b.外源载体序列:仅提供目标序列则仅检测目标序列的插入情况,如果提供完整载体序列,可同时检测载体骨架是否插入;
c.外源转入个体的全基因组重测序数据:≥30X
Q检测结果的准确度如何?
下述等因素均会影响到检测结果,使得具体插入位点、具体插入方式评估异常:
a.外源片段与参考基因组的同源性:较高的同源性会影响reads比对结果;
b.转化实验:转化效率导致细胞中大量游离外源序列参与后续测序、外源片段自连接后插入、载体骨架插入、载体计划外断裂位置插入等影响;
c.测序深度:较低的测序深度会导致插入位点区域支持reads条目过少,无法精确插入位点;
-
- Doudna JA. The promise and challenge of therapeutic genome editing. Nature. 2020;578(7794):229- 236. doi:10.1038/s41586-020-1978-5
- Mushtaq M, Ahmad Dar A, Skalicky M, et al. CRISPR-Based Genome Editing Tools: Insights into Technological Breakthroughs and Future Challenges.Genes(Basel). 2021;12(6):797. Published 2021 May 24. doi:10.3390/genes12060797
- Ahmar S, Saeed S, Khan MHU, et al. A Revolution toward Gene-Editing Technology and Its Application to Crop Improvement. Int J Mol Sci. 2020;21(16):5665. Published 2020 Aug 7. doi:10.3390/ijms21165665
- Sahu PK, Sao R, Mondal S, et al. Next Generation Sequencing Based Forward Genetic Approaches for Identification and Mapping of Causal Mutations in Crop Plants: A Comprehensive Review. Plants (Basel). 2020;9(10):1355. Published 2020 Oct 14. doi:10.3390/plants9101355
- Wang XJ, Jiao Y, Ma S, Yang JT, Wang ZX. Whole-Genome Sequencing: An Effective Strategy for Insertion Information Analysis of Foreign Genes in Transgenic Plants. Front Plant Sci. 2020 Dec 1;11:573871. doi: 10.3389/fpls.2020.573871.
- Itoh T, Onuki R, Tsuda M, Oshima M, Endo M, Sakai H, Tanaka T, Ohsawa R, Tabei Y. Foreign DNA detection by high-throughput sequencing to regulate genome-edited agricultural products. Sci Rep. 2020 Mar 18;10(1):4914. doi: 10.1038/s41598-020-61949-5.
- Kersten B, Leite MontalvãoAP, Hoenicka H, Vettori C, Paffetti D, Fladung M. Sequencing of two transgenic early-flowering poplar lines confirmed vector-free single-locus T-DNA integration. Transgenic Res. 2020;29(3):321-337. doi:10.1007/s11248-020-00203-0
- Sun L, Ge Y, Sparks JA, et al. TDNAscan: A Software to Identify Complete and Truncated T-DNA Insertions. Front Genet. 2019;10:685. Published 2019 Jul 25. doi:10.3389/fgene.2019.00685
- Xu W, Zhang H, Zhang Y, et al. A paired-end whole-genome sequencing approach enables comprehensive characterization of transgene integration in rice. Commun Biol. 2022;5(1):667. Published 2022 Jul 5. doi:10.1038/s42003-022-03608-1
- Chen X, Dong Y, Huang Y, Fan J, Yang M, Zhang J. Whole-genome resequencing using next-generation and Nanopore sequencing for molecular characterization of T-DNA integration in transgenic poplar 741. BMC Genomics. 2021;22(1):329. Published 2021 May 6. doi:10.1186/s12864-021-07625-y
- Giraldo PA, Shinozuka H, Spangenberg GC, Smith KF, Cogan NOI. Rapid and Detailed Characterization of Transgene Insertion Sites in Genetically Modified Plants via Nanopore Sequencing. Front Plant Sci. 2021;11:602313. Published 2021 Feb 4. doi:10.3389/fpls.2020.602313
- Thomy J, Sanchez F, Gut M, et al. Combining Nanopore and Illumina Sequencing Permits Detailed Analysis of Insertion Mutations and Structural Variations Produced by PEG-Mediated Transformation in Ostreococcus tauri. Cells. 2021;10(3):664. Published 2021 Mar 17. doi:10.3390/cells10030664