16S/18S/ITS菌群测序 宏基因组 宏转录组 细菌/真菌重测序 细菌完成图 |
微生物多样性扩增子测序
Ι 背景介绍
扩增子测序——是使用细菌、真核生物、真菌通用引物,分别扩增研究环境下微生物群体的16S rDNA/18SrDNA /ITS高变区或功能基因,通过高通量测序获得巨量扩增产物序列信息,并通过生物信息学算法与统计学,搜集变异信息、物种组成丰度信息,分析特定环境下的微生物群落的多样性和分布规律,以揭示环境样品中微生物的种类、相对丰度、进化关系等。
Ⅱ 样本要求
注:1、不接收培养平皿、培养试管、和大管纯菌液样本,易造成环境污染;
2、不接收0.2/0.6mLPCR管装载的原始样本/核酸样本。易丢失、开管、样本标记不清晰等;
3、若送DNA样本,请保证体积>25ul。质检需要消耗,扩增片段消耗,可能出现不够的情况。
Ⅲ 扩增区段选择
【细菌】——16S测序
细菌核糖体RNA(rRNA)有三种类型:5SrRNA(120bp)、16S rRNA(约1540bp)和23S rRNA(约2900bp)。5S rRNA基因序列较短,包含的遗传信息较少,不适于细菌种类的分析鉴定;23S rRNA基因的序列太长,且其碱基的突变率较高,不适于鉴定亲缘关系较远的细菌种类;16SrRNA普遍存在于原核细胞中,具有含量高、拷贝数多特点(占细菌RNA总量的80%以上),便于获取模板,功能同源性高,遗传信息量适中,适于作为细菌多样性分析标准。
16S rRNA编码基因序列共有10个保守区和V1-V9共9个高变区。V3-V4区变异区长,数据库信息全,是二代细菌多样性分析注释的最佳选择。多样性的组成核心在于SNP多样性,
16S标准引物推荐——参考文献:DOI: 10.1371/journal.pone.0006669
上游引物名称338F:ACTCCTACGGGAGGCAGCA
下游引物名称806R:GGACTACHVGGGTWTCTAAT
三代16S将检测V1-V9区域测通。
【真核生物】——18S测序
真核微生物中也有三类核糖体RNA(rRNA),包括5.8S rRNA、18S rRNA和28SrRNA。18S rRNA基因是编码真核生物核糖体小亚基的DNA序列,具有保守区与可变区(V1-V9,没有V6区)。保守区域反映了生物物种间的亲缘关系,而可变区则能体现物种间的差异,适用于作种级及以上的分类标准。其中,V4区使用频次最多、数据库信息最全、分类效果最好,是真核18S测序分析注释的最佳选择扩增区段。
【真菌】——ITS测序
ITS序列是内源转录间隔区(Internally Transcribed Spacer),位于真菌18S、5.8S和28S rRNA基因之间,分别为ITS 1和ITS 2。 在真菌中,5.8S、18S和28S rRNA基因具有较高的保守性,而ITS由于承受较小的 自然选择压力,在进化过程中能够容忍更多的变异,在绝大多数真核生物中表现出极 为广泛的序列多态性。同时,ITS的保守型表现为种内相对一致,种间差异较明显,能 够反映出种属间,甚至菌株间的差异。并且ITS序列片段较小(ITS 1和ITS2长度分别 为350 bp和400 bp),易于分析,目前已被广泛用于真菌不同种属的系统发育分析
Ⅳ避坑指南
(1)16S选择的测序区域各不相同(如V4,V3-V4,V1-V3,V3等),选择的依据是什么,选择哪个区域比较好?
首先确认一点:不同物种、不同V区,多样性不同,选择不同区域测序结果会有不同,可能会造成物种多样性的低估或高估。在非全长16S(三代测序V1-V9测通)测序的情况下,测序区域也并非越长越好,跟全长16S结果最相近的测序区域即是最优选择。如无特殊要求,我们一般推荐V3-V4区测序,根据项目经验,目前测序项目较多的区域为V4(通用), V1-V3(皮肤与生殖道) V3-V4(通用), V4-V5(通用),具体区域也可参考相关文献进行选择。
(2)扩增子测序能满足的测序长度是多少?
Illumina公司有2款扩增子常用测序仪,Novaseq6000与Miseq。MiseqPE300(Pair end 300bp)模式测序长度为600bp,但Miseq老平台测序质量较差,仅质控就要过滤掉100bp+低质量序列,实际可用数据有限;Novaseq6000测序仪PE250(Pairend 250bp)模式测序质量较好,但测序总长度为500bp,去掉barcode、index和前几个低质量碱基,约剩余480bp左右可用数据。所以保守起见,扩增子片段长度不要超过480bp,否则影响序列拼接。
(3)16S测序一般准备多少样本个数?
关于微生物扩增子测序,不论16S还是其他,样本多样性、组间差异分析等等,均是基于生物统计学范畴进行的分析,组内/整体样本数越多,统计结果越准。检测下限:样本间多样性分析(n≥4),组间多样性分析样本(组别≥2,每组样本数n≥3)。
如果同计划做代谢组,由于质谱本身的技术差异,一般一组内样本数量(n≥30),除样本极其难得情况可酌情减量外,组内低于30例样本不建议做。
(4)研究环境中真核微生物多样性,18S测序和ITS测序哪个更好?
18S测序针对的是真核微生物,注释到的范围广,但是就真菌来说精确度相对较低;ITS测序主要是针对真菌多样性的研究,注释准确度高;可根据研究目的合理选择测序方案。
V 项目流程
VΙ 部分结果展示
宏基因组测序
Ι 背景介绍
自然界的微生物物种至少达到百万数量级,然而目前发现的只有数万种,绝大多数的微生物物种都无法在实验室条件下通过培养分离获得。
因而,尽管微生物蕴藏着极为丰富的物种资源和基因资源,但它们在生理生化、代谢活性和行为功能等多方面的特性还有待更深层次的挖掘,
人类对于它们的认知也将随之不断刷新。借助NGS技术 (Next Generation Sequencing,NGS) ,我们可以对微生物基因组的特定区域进行扩增子测序 (Amplicon sequencing),普查群落的具体组成结构,掌握其多样性变化规律,并揭示其中的优势物种;在此基础上,还可以进一步开展宏基因组(Metagenome)、宏转录组 (Metatranscriptome)和宏病毒组 (Virome)研究,通过鸟枪法测序技术 (Shotgun sequencing),结合全微生物组关联分析 (Microbiome-Wide Association Studies,MWAS)的策略,分别从 DNA 和 RNA 水平,更全面精细地展示整个群落的功能代谢谱和表达谱(宏病毒组可以针对DNA病毒和RNA病毒分别进行测序研究,此时,将只关注群落中各类病毒的组成、功能和相互作用),进而从原理上阐明微生物群落在生态系统中发挥作用的根本机制。
Ⅱ 样本要求
注:
1、不接收原始的——培养平皿、培养试管、和大管纯菌液样本,易造成样本与实验环境污染;
2、不接收小PCR管装载的原始/核酸样本。易丢失、裂管、标记不清晰等,建议1.5mL/2.0mL EP管装载;
3、若送DNA样本,请保证体积>25ul。质检需要消耗,扩增片段消耗,可能出现不够的情况
Ⅲ 技术特点
可以直接获得微生物功能基因的相对丰度
基于已知物种, 鉴定分辨率可达物种、甚至菌株水平
不需要微生物群落相关的先验知识 (如捕获噬菌体、病毒、质粒以及微小真核生物等)
基本不会产生PCR偏好性
可以估算有参考基因组微生物的原位生长速率
可组装获得群体平均基因组 (甚至可以获得其中一些微生物较完整的基因组)
可以挖掘新的基因家族。
IV应用场景
医学领域:常见疾病与人体微生物的关系研究,肠X轴、感染领域等
动物领域:牲畜肠道、瘤胃(如产甲烷菌类群)与动物健康、营养消化研究等
农业领域:根际微生物与植物互作、农业耕作、施肥处理、菌剂开发、土壤微生物群落研究等
环境领域:雾霾处理、污水治理、石油降解、酸性矿水处理及海洋环境研究等
特殊极端环境:极端环境条件下的微生物类群研究
【避坑指南】
(1)关于宏基因组测序数据量选取。多少才够?当销售员推荐6G就行,我该怎么选?
【Tip 1】:宏基因组测序不区分DNA来源,来自宿主和细胞器DNA污染可能会掩盖微生物的特征。
不论是宿主还是微生物,都会被测出。若送测样本为【宿主组织+待测样本】情况,如【肠粘膜、肿瘤组织、整段肠道+内容物】,通常需要提高测序数据量到10G左右,甚至更高,以保证数据下机后,从数据端剔除宿主序列,获取可用微生物数据进行后续分析。
【Tip 2】看样本复杂程度
所谓样本复杂程度,就是样本本身DNA的多样性初步判断。举例:比如人类肠道取得粪便样本,属于厌氧环境,虽然人类宿主DNA+细菌DNA+真菌DNA+病毒DNA+部分真核生物DNA等种类较多,大类相对简单,常规6G足够。如果是环境类样本,其中的微生物同时存在厌氧型、共生型、腐生型、兼性厌氧型等等,功能复杂,这种一般需要测10-15G,甚至更高。
【Tip 3】是否进行Contig Binning分析
简单说就是把宏基因组数据中来自同一菌株的序列聚到一起,得到一个菌株的基因组。根据基于聚类的序列类型的不同,分为reads binning,contig binning 和 genes binning。近年来高分文章中多使用Contig Binning,即将组成相似或丰度一致的Contigs聚类到同一物种从而完成单菌的草图组装,进一步解析菌株的功能特性。
若单个样本做binning,肠道/粪便样本推荐 10G-15G,环境类样本推荐20G以上。
如果有生物学重复,则生物学重复样本总测序量大于20G亦可进行binning分析。
(2)扩增子16S测序 vs 宏基因组,该怎么选择。以下是选宏基因组的场景:
【场景一】功能与物种对应起来:
①、同时关注多个功能基因在样本群体中的丰度变化和差异大小;
②、研究各种代谢循环: 碳/氮/磷/硫循环等
③、关注抗性基因、可移动遗传元件等多样性组成谱/功能基因测序无法解答的问题
【场景二】
①、要求物种注释分辨率提升高至种、亚种水平。二代16S只能到属水平。
②、关注样本中不同类别微生物 (比如细菌、古菌、真菌、病毒等) , 并对丰度高低作相互比较。
V 部分结果展示
重测序
细菌完成图
Ι 背景介绍
Ⅱ 样本准备
Ⅲ 避坑指南
(1) Thebetter the sample, the better the result
(2) Theworse the sample, the worse the result
(3) 同组内,保证样本生物学重复≥3,建议3-5例(注意,非技术重复!)否则可能会遇到审稿人问:How was the statistical analysispossible with only 1/2 biological replications?
(4)
(5)
(6)
Ⅳ 项目流程
V
VI
|