|
产品简介基因组重测序(Re-Sequencing)是对已知基因组序列信息的个体进行测序,可在此基础上对个体或群体进行基因型差异性分析。基因组重测序主要用于辅助研究者发现大量的单核苷酸多态性位点(SNP)、拷贝数变异(Copy Number Variation,CNV)、插入缺失(InDel,Insertion/Deletion)等变异位点,以高效准确获得生物群体的遗传特征,并方便进行全基因组关联性分析(GWAS),在人类疾病和动植物育种研究等方面意义重大。 Types of genome alterations that can be detected by next-generation sequencing Meyerson et al., Nature Reviews Genet,2010 我们的优势1. 重测序分析加速:烈冰开创了从任务投递、数据切分到容器多线程的三重调度加速框架,最终实现了重测序分析的大幅度加速,4小时即可完成一个样本的人类重测序分析,较传统的分析方法(68-92小时)提高了十多倍速度; 2. 定制化分析策略:根据不同测序物种和测序方案,定制化选择参考基因组版本、比对算法和注释用数据库区域信息等; 3. 全面的数据库整合:不断更新基因组数据库并进行多数据库多版本整合,获得准确的基因信息与注释; 4. 强大的组学联合分析能力:将基因组重测序与转录组测序和甲基化测序等技术进行结合,将单一的基因变异数据进一步拓展。 样本要求组织样品: 1. 新鲜动物组织干重≥0.5g 2. 新鲜植物组织干重≥2g 3. 新鲜培养细胞数≥4×106个 4. 全血(哺乳动物)≥1ml 5. 全血(非哺乳动物)≥0.5ml DNA样品要求: 1. DNA总量≥2μg,浓度≥20ng/μL,体积要求15-100μL; 2. OD260/280介于1.8-2.0之间; 3. Agilent 2200质检合格,DNA样本主峰范围在100-500bp; 4. 电泳检测无明显RNA污染,基因组条带清晰、完整,无降解; 5. 送样时请标记清楚样品编号,管口使用Parafilm膜密封; 6. 样品保存期间切忌反复冻融; 7. 送样时请使用干冰运输。 实验流程1. 客户样本:新鲜培养细胞数≥4×106个; 2. 提取基因组DNA:DNA总量≥2μg; 3. DNA质控:Agilent 2200质检合格,DNA样本主峰范围在100-500bp; 4. 文库构建:随机引物PCR扩增; 5. 上机测序:测序数据量达到50X覆盖深度,不同物种间存在差异,人一般达到30X。 数据分析流程结果示例1、原始数据质量控制采用Fastp软件对下机原始数据进行低质量序列,未检测序列,接头序列的过滤处理,并对于过滤前后数据的GC比值,碱基质量,长度分布,接头留存,Duplication比率等指数进行![]() 碱基质量结果图分析。 注:左图横坐标代表碱基位点,纵坐标代表碱基质量值,不同颜色曲线代表不同碱基在每条read上的质量值;右图横坐标代表碱基位点,纵坐标代表碱基含量比值,不同颜色曲线代表不同位点各碱基含量。 2、DNA基因组比对(DNA Mapping)与质控采用BWA-mem/Bowtie2等算法将质控后的测序数据与基因组进行比对,得到基因组比对的bam文件。并基于bam文件进行信息统计,得到reads在染色体上的分布情况、基因组比对率等信息。 DNA Mapping结果 Yamagishi MEB et al., PLoS One. 2017 注:该图展示了不同品系bull的测序reads的mapping率 3、突变分析采用GATK/Samtools等算法,对基因组比对文件进行突变(包括SNV、InDel)分析,得到突变结果。 call SNP分析结果 Kong HR et al., AJAS. 2018 注:该图展示了不同分组每条染色体SNP的数量 4、拷贝数变异(CNV)分析采用CNVKit算法,对基因组比对文件进行拷贝数变异分析,得到拷贝数变异结果。 CNV区域在全基因组上的分布 Khatri B et al., PLoS One. 2019 注:该图展示了不同品系(HS和LS)的Japanese quail CNV区域在全基因组上的分布情况。外圈为HS品系,内圈为LS品系 5、数据库注释通过VEP对突变分析结果进行注释,获得所有突变位点对应的基因及其变异位点的注释情况。 突变注释结果 注:该图展示了基于数据库鉴定的突变类型,以及不同突变类型数量的占比情况 |