中国热科院环植所农业环境研究团队在陆地生态系统中全程氨氧化菌环境分布与偏好的机器学习预测研究方面取得新进展。针对前人研究只考虑非生物性预测因子来预测土壤全程氨氧化菌环境分布与偏好,忽略共存物种作为预测因子的重要性问题,团队提出新的机器学习预测模型框架,即考虑共存物种作为预测因子,证实了全程氨氧化菌丰度的生物性预测因子的预测能力强于非生物性预测因子。该成果为利用机器学习算法研究陆地生态系统中全程氨氧化微生物环境分布规律与适应机制提供了新思路。
长久以来,普遍认为氨氮氧化为硝态氮的过程是由进化关系并非近缘的两类典型微生物分步接力完成的。直至2015年,Nature杂志同步发表的两项研究证实:3种属于亚硝酸氧化细菌的硝化螺菌属谱系II的可培养菌株如 Candidatus Nitrospira inopinata、Candidatus Nitrospira nitrosa 和 Candidatus Nitrospira nitrificans 具备一站式完成氨氮氧化为硝态氮的能力。该研究才突破学界关于自然界硝化作用两步论的经典认知,并推动全程氨氧化微生物环境分布规律与适应机制研究成为氮循环研究热点。但过去10年,几乎所有的机器学习模型研究只考虑非生物性预测因子(如土壤、气候)来预测全程氨氧化菌环境分布与偏好,忽略了共存物种(如半程硝化微生物AOA、AOB)作为预测因子的重要性。为此,研究团队创造性提出新的模型框架,将AOA、AOB作为生物性预测因子,并采取大数据整合分析、随机森林模拟等手段进行系统分析,研究结果表明:作为全程氨氧化菌丰度的潜在生物预测因子,AOA、AOB预测能力强于非生物性预测因子如土壤pH 、铵含量;作为分支(Comammox Nitrospira clades A and B)丰度的有效预测因子, 土壤pH 、铵含量并不能有效预测总体丰度;不考虑共存物种影响的机器学习预测,即只考虑非生物性因子作为预测因子,有可能产生预测偏差,而抬升非生物性预测因子的权重与排序,致使不能正确识别变量重要性与重要性变量;而重要性变量识别不准,就难以通过预测重要性变量的边际效应来预测环境偏好。
研究成果以“Factors predictive of the biogeographic distribution of comammox Nitrospira in terrestrial ecosystems ”为题发表于《Soil Biology and Biochemistry》。中国热科院环植所高文龙博士为第一作者兼通讯作者,陈淼副研究员为该论文共同通讯作者。这是团队本年度在《Soil Biology and Biochemistry》发表的第二篇高水平文章。该研究得到了海南儋州热带农业生态系统国家野外科学观测研究站支持,得到了广东省面上基金、国家自然科学基金、海南省重点研发计划、海南省自然科学基金等项目的资助。
全程氨氧化菌环境分布与偏好的机器学习预测
论文全文链接:https://www.sciencedirect.com/science/article/pii/S0038071723001414?dgcid=author