四时宝库

程序员的知识宝库

微生物群落结构分析常见方法(微生物群落是如何形成的)

微生物群落结构分析是从整体的角度分析各组样品的微生物群落之间是否有显著差异,从而分析实验所关注的因素是否会导致环境微生物群落结构的显著变化。α 多样性、β 多样性以及依据样品间不相似性进行排序分析和聚类分析是微生物群落结构分析的主要方法。

α 多样性是样本内物种多样性(Within-sample diversity),反映每个样本的物种的丰富度和均匀度。α 多样性的高低由 α 多样性指数表征,在 16S rRNA 测序数据分析中常用的有香农 - 威纳多样性指数(Shannon-wiener diversity index),辛普森多样性指数(Simpson diversity index),Chao1 丰富度估计量(Chao1 richness estimator)等。QIIME、Mothur、PAST等软件都可以进行多种 α 多样性指数的计算。

β 多 样 性 是 指 样 本 间 多 样 性(Between-sample diversity),其高低反映每个组内各个样本的群落物种组成差异的大小。人类微生物组计划通过计算同一组内各个样品间的距离来表征各个组的 β 多样性,通过比较数值大小来比较各个组的 β 多样性。更形象化的做法是利用距离表征出的样品间的关系,通过主成分分析(Principal component analysis,PCA)、主 坐 标 分 析(Principal coordinates analysis,PCoA)等作图方法将所有样品在二维坐标系中表现出来,从而从侧面反映各个组的 β 多样性及各样品之间的相互关系。

PAC分析示意图

PCoA分析示意图

微生物群落样品间距离即群落之间的不相似性,两个群落越不相似,它们之间的距离越大。传统生态学上应用较多的布雷 - 柯蒂斯距离(Bray-Curtisdissimilarity)在微生物 16S rRNA 测序分析中也广泛应用。然而布雷柯蒂斯距离将不同的OTU 视为完全没有联系的单位,导致 16S rRNA 测序数据中存在着的丰富的序列信息没有得到有效的应用,UniFrac 距离解决了这个问题。UniFrac距离利用测序序列信息建立的物种系统发育树,考虑了物种的相似度:如果一个群落中的某物种变成另一个群落中进化关系相近的物种,则视为较小的变化,所反映出的两个群落的距离较小;如果一个群落中某物种变成另一个群落中进化关系较远的物种,则视为较大的变化,两个群落距离较大。非加权UniFrac(unweighted UniFrac)只考虑了物种有无的变化,加权 UniFrac(weighted UniFrac)同时考虑了物种有无和物种丰度的变化。UniFrac 距离可以在UniFrac 网站进行在线计算,也可以通过QIIME分析流进行计算,二者也都可以直接依据UniFrac距离给出 PCA 或 PCoA 图。

聚类分析是另一种直观表示样品间相互关系的方法。该方法利用样品间距离的数据,建立样品的系统发生树,以反映各个样品的聚类情况。QIIME分析流中采用不加权配对组算术方法(Unweightedpair group method with arithmetic mean,UPGMA)法进行聚类,并且折刀分析法(Jackknifing analysis)验证该系统发生树的稳健性。一般来说,系统发生树所反映的样品间聚类或距离的信息少于 PCA 或PCoA 图,因此聚类分析在肠道微生物16S rRNA测序的生物信息学分析中并不常用。

发表评论:

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言
    友情链接