docx文档 简化基因组测序技术及其在海洋生物研究中的应用

专业资料 > 农林渔牧 > 水产渔业 > 文档预览
14 页 0 下载 140 浏览 0 评论 0 收藏 3.0分
温馨提示:如果当前文档出现乱码或未能正常浏览,请先下载原文档进行浏览。
简化基因组测序技术及其在海洋生物研究中的应用 第 1 页 简化基因组测序技术及其在海洋生物研究中的应用 第 2 页 简化基因组测序技术及其在海洋生物研究中的应用 第 3 页 简化基因组测序技术及其在海洋生物研究中的应用 第 4 页 简化基因组测序技术及其在海洋生物研究中的应用 第 5 页
下载文档到电脑,方便使用
还有 9 页可预览,继续阅读

简化基因组测序技术及其在海洋生物研究中的应用内容摘要:

doi: 10.6043/j.issn.0438-0479.201607015 简化基因组测序技术及其在海洋生物研究 中的应用 边 力,王 军* (厦门大学海洋与地球学院,福建 厦门 361102) 摘要:传统开发遗传标记的方法通常会消耗大量的时间和人力物力,伴随着高通量测序技 术的飞速发展,一种高效的标记开发技术即简化基因组技术开始得到广泛应用。简化基因 组技术可以在一次实验中获得成千上万的遗传标记,建库过程简易,成本较低。其通过实 验手段降低基因组的复杂度,仅对部分基因组进行测序,随后在该部分获得的基因组开发 分子标记。基于酶切的简化基因组技术可以分为三大类:简化代表库测序;限制性酶切位 点相关 DNA 测序;低覆盖度的分型测序。在海洋生物研究中,简化基因组技术已被广泛 应用于群体遗传学、系统进化学、适应性进化、遗传图谱构建及 QTL 定位等研究领域。 关键词:简化基因组;海洋生物;基于测序的基因分型;限制性酶切位点相关 DNA 测序 中图分类号:Q341 文献标志码:A 遗传标记是存在于生物不同群体、不同个体间可遗传的具多样性的内在特征,它是群 体遗传学及分子系统进化等研究的基础。在过去的几十年中,DNA 分子标记技术得到了长 足的发展,从 80 年代初的限制性片段长度多态性(restriction fragment length polymorphism, RFLP)[1] ,到目前应用十分广泛的微卫星 DNA(microsatellite DNA)[2] 以及单核苷酸多态性 (single nucleotide polymorphism, SNP)[3] ,基于不同技术开发手段的分子标记层出不穷。目 前,DNA 分子标记在种类上已经基本可以满足研究的需要,然而随着高通量测序技术 (next-generation sequencing, NGS)的飞速发展,研究人员更加关注标记数量上的提升,即如 何从高通量的测序结果中获得更多标记。标记数量的提升意味着其覆盖度和分辨率的提升 Luikart 等[4]曾提出如果有一种简单、可靠的分子技术,可以在一次实验中获得数百个覆盖 整个基因组的分子标记,那么这无疑是研究群体遗传基因组学最为理想的实验技术。近些 年发展起来的简化基因组测序技术(reduced-representation sequencing)即为一种十分有前景 的、可以在一次实验过程中获得成千上万标记的技术,并且其可以广泛应用于非模式生物 (未完成全基因组测序的物种)的研究。 利用传统的实验方法开发上文提到的微卫星 DNA 和 SNP 通常是非常繁琐和耗时的, 一般会涉及到多次的设计引物、PCR 扩增以及基因克隆,并且每次的实验过程只能够针对 一个标记。在基因分型时,虽然可以选择多种不同的方法,但整个分型过程仍然是繁琐复 杂甚至昂贵的。21 世纪初开发出的 SNP 芯片技术[5]可以在很大程度上提高基因分型的效率, 然而其开发的过程同样十分耗时耗力,且该技术并不十分适用于对于新的群体或遗传距离 较远群体的研究,因为芯片开发过程中使用的样本仅来源于少量的群体,在对新的群体检 测时结果会出现偏差。相比较而言,本文所介绍的基于 NGS 的简化基因组技术可以集标记 收稿日期:2016-07-13 录用日期:2016-08-23 基金项目:国家自然科学基金(31372504;41476118) *通信作者:junw@xmu.edu.cn 开发、测序和分型于一次实验过程中,且一次实验可包括大量样品并检测出成千上万的可 用标记。同时,随着 NGS 测序成本的逐步降低,大部分实验室均可以承受起简化基因组的 测序工作。简化基因组另外一个优点就是其仅需如酶切、连接、PCR 等基本的实验技能, 即便是刚刚接触分子实验的科研人员也可以在经过一定的学习后构建起合格的测序文库。 本文将首先展开介绍简化基因组相对于传统方法所具有的优势,接着介绍基于酶切的几大 类简化基因组实验技术,最后对于该技术在海洋生物领域的研究进展进行一定的总结。 1 简化基因组测序技术用于开发分子标记的优势 1.1 NGS 测序原理带来的效率提高 分子标记开发的一般思路是寻找不同个体间同源序列存在的差异。在传统的 Sanger 法 测序中[6],通过对于不同的同源位点设计引物进行 PCR 反应,可以直接获得不同个体在该 同源位点的序列,进而寻找可用的分子标记。与 Sanger 法不同,基于 NGS 的测序方法并 不会刻意地对某些同源位点进行基于 PCR 的扩增富集,而是通过实验处理将整个基因组打 断,对于打断后形成的一个个 DNA 片段进行富集测序 [7]。在此基础上,简化基因组测序技 术又通过一定的手段选取基因组的一部分对其进行最终的测序。简化基因组技术可以通过 一次测序获得成千上万的同源位点,而传统的方法,要获得成千上万的同源位点就意味着 成千上万次 PCR 反应。这种基于 NGS 的简化基因组测序技术的另一个优势就是在一次实 验过程中,标记的开发和分型工作可以同时完成。传统的分子标记开发过程都是首先对于 大量潜在标记的筛选,接着保留可用标记,对分析群体进行标记位点的扩增,最后进行标 记的分型,每一步都伴随着大量人力物力时间的消耗。因而,简化基因组无论在获得标记 的数量上还是时间的消耗上都要明显的优于传统的方法。当然,随着全基因组测序成本的 不断降低,或许在不久的将来大部分实验室也可以负担起群体的全基因组测序,但近期来 看,简化基因组测序仍然是最为适合分子标记开发的技术。 1.2 “标签”技术带来的成本降低 简化基因组测序成本低的一个重要原因是其一次测序反应即可包括数十个甚至上百个 个体,而为了达到这样的目的就一定需要某种手段可以在得到的大量数据中区分出每个个 体[8]。而该种手段就是在制备测序文库的过程中为每一个个体添加“标签”(barcode),即 一小段的核苷酸序列。每一个“标签”都具有其独特的核苷酸数量和组成,通过后续识别这 些“标签”就可以将不同的个体鉴别出来。添加“标签”可以通过 PCR 反应[9]或连接反应[10]。 最为理想的“标签”首先应尽可能的短,这样可以尽量少的占用测序读长;同时还要有效地 区分不同的个体;最后“标签”还应有一定的抗干扰能力,即在出现测序错误的时候仍然可 以保持相对准确的鉴定[11]。通过分层级加“标签”的方法可以在同一个测序文库中标记成百 上千的个体[12],经过标记后的个体就可以混合成为一个最终的测序文库。虽然混合可以降 低成本,但也有缺点:混合后的后续数据分析有可能会漏掉某些稀有等位基因;同时制备 文库的每个个体的 DNA 量是否相近也会对后续分析产生影响[13];在缺少高质量参考基因组 的情况下,混合也使得基于观察杂合度的后续数据筛选受到影响 [14]。除了添加用于识别每 个个体的“标签”外,还需要为每一个 DNA 片段添加适用于不同测序平台的测序接头序列, 其含有测序引物的结合位点。除了使用昂贵的文库制备试剂盒,简化基因组技术也可以通 过简单的酶切、连接、PCR 来完成“标签”和测序接头的添加,在具有一般配备的分子实验 室即可完成。 2 基于酶切的简化基因组测序技术介绍 为了开发分子标记,若对不同群体内的所有个体都进行全基因组测序将是十分昂贵的, 而基于部分基因组开发得到的分子标记已经可以满足大部分研究的需要,这是应用简化基 因组技术的前提。本文介绍基于酶切的简化基因组测序技术,可以将其分为三大类(表 1): 简化代表库测序,其包括简化代表库测序(reduced-representation libraries, RRLs)以及简化多 态序列复杂度测序(complexity reduction of polymorphic sequences, CRoPS);限制性酶切位点 相关 DNA 测序(restriction site-associated DNA sequencing, RAD-seq);低覆盖度的分型测序, 包 括 基 于 测 序 的 基 因 分 型 (genotyping by sequencing, GBS) 和 多 元 鸟 枪 法 基 因 分 型 (multiplexed shotgun genotyping, MSG)。 2.1 简化代表库测序 简化代表库测序的基本思想为选取酶切后的部分片段,实现对基因组的简化;此时不 同个体所保留的酶切片段会各不相同,但所有个体所保留的片段的集合可以对于基因组有 较好的覆盖,基于此进行测序并开发分子标记。主要包括两种技术,分别是 RRLs 和 CRoPS。 2.1.1 简化代表库测序(RRLs) RRLs 最早被用于建立人类基因组的 SNP 图谱[15],Van Tassell 等[16]在 2008 年首次系统 地阐述了结合 NGS 的 RRLs 技术,其基本实验流程首先是对样本进行限制性内切酶的酶切 并将不同样本的酶切片段进行混合,随后进行酶切片段长度的选择,接着连接测序接头, 最 后 进 行 上 机 测 序 。 RRLs 的 建 库 方 法 一 般 可 以 保 留 初 始 酶 切 产 生 片 段 即 基 因 组 的 1~10%[7]。在最为简化的 RRLs 实验过程中,在测序时可以只对酶切片段的两端进行测序, 当然也可以通过调整实验方法对获得的整个酶切片段进行测序 [17]。早期的 RRLs 技术[16]将 群体内的所有个体都进行了混合,因而只能对整个群体的群体遗传参数进行估计。为了计 算群体内的个体间的遗传参数,就需要为每个个体在混合前添加“标签”用以区分。获得的 测序片段根据是否有高质量的参考基因组进行不同的处理:当存在参考基因组时,可以将 获得的测序片段比对到基因组上进而寻找 SNP 标记,与基因组重测序技术相似[18];当不存 在参考基因组时,首先需要对获得的测序片段进行 de novo 拼接,以拼接后的片段作为参考 序列进行比对寻找 SNP。RRLs 广泛地应用于 SNP 的开发[19-21]、遗传多样性研究[22]以及性状 关联分析[23]。 2.1.2 简化多态序列复杂度测序(CRoPS) 2007 年提出的 CRoPS[24]在文库制备的过程中结合了 AFLP 的方法,通过两种限制性内 切酶(Hpa II 和 Mse I)来打断两个玉米的自交系,随后经过连接接头和两轮的 AFLP 扩增为 两个自交系分别添加了用以区分的“标签”,最后将两组样品混合上机测序。CroPS 技术适 用于基因组含有大量重复序列且(或)DNA 多态性较低的物种,如某些经过选育的农作物品 种[7]。CRoPS 已被应用于玉米 SNP 的开发[24-25]以及群体遗传学研究[26-27]。 2.2 限制性酶切位点相关 DNA 测序(RAD-seq)

本文档由 sddwt2022-04-08 17:15:25上传分享
给文档打分
您好可以输入 255 个字符
本站的域名是什么?( 答案:sciwk.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言