4-22、成分数据网络推断方法及其在宏基因组数据中的应用

4-22、成分数据网络推断方法及其在宏基因组数据中的应用

Network Inference for Compositional Data and Its Application to Metagenome Data

邓明华

北京大学数学科学学院

摘要:随着高通量测序技术的进步,各种微生物群落的宏基因组测序数据得以积累,该数据的最大特点是只有各物种的相对丰度具有意义,统计上称之为成分数据。从成分数据中进行网络推断可以帮助人们了解微生物群落结构背后的生物机制。在这个报告中,我将介绍本课题组最近发展的两个算法: gCoda和CDTrace. 我们将网络推断问题转换为成分数据背后的绝对量数据的精度矩阵估计问题。gCoda是一个带惩罚的极大似然估计方法,而CDTrace是一个带惩罚的D-Trace损失函数估计方法,我们开发了相应的算法进行优化。在模拟数据和真实数据上都表明了算法的有效性,优于现有算法SPIEC-EASI。

关键词:成分数据,精度矩阵,网络推断,微生物群落.

DOI:10.12110/secondfmge.20181014.422

Brief Introduction of Speaker
邓明华

北京大学数学科学学院教授,中共党员。1987年9月-1998年1月在北京大学数学系学习,分别获学士、硕士和博士学位。毕业后留校任讲师,2003年8月晋升为副教授,2009年8月晋升为教授。其间于2001年2月-2003年8月在美国南加州大学计算生物学中心从事博士后研究,2009年8月-2010年1月在美国耶鲁大学担任访问副教授。邓明华从事生物信息学研究,发表SCI论文70余篇,先后主持5个基金委面上项目,1个863项目,参加3个973项目和1个科技部重点研发计划项目。

通讯方式:电话 010-62767562,Email: dengmh@pku.edu.cn