2016年7月4日下午4点整,阿拉巴马大学伯明翰分校公共卫生学院生物统计系首席教授、学院流行病与卫生统计学系讲座教授易能君博士为我们做了题为《Stastistical Methods for Mmicrobiome Data Analysis》的学术报告。会议由学院张永红院长主持,各系(教研室、中心)负责人和学院老师、研究生等50多人参加了此次学术报告。

首先,张永红院长向大家简要的介绍了易能君教授的基本情况。易能君教授在生物统计学、遗传流行病学和贝叶斯统计学研究领域具有重要的影响力。他针对高维遗传学数据首创了全基因组多个QTL 定位和遗传关联分析Bayesian Lasso 方法,相关成果发表在著名遗传学期刊《Genetics》上;主要论文已被广泛引用,并作为同行衡量新方法的参考标准,相关工作得到国际生物统计学界权威专家的髙度评价;此外,易能君教授还开发了基于贝叶斯理论的处理高维遗传数据的R 语言程序包BhGLM。近十年的研究工作先后获得两项R01 项目资助,创新性地构建了新的统计遗传模型和分析方法,为复杂疾病的基因发现提供了新的策略。在学院履职的两年中,对流行病与卫生统计系的学科发展、人才培养、项目申请、论文撰写等方面做出了很大的贡献。在他的指导下,先后有1人获得国家自然基金面上项目,1人在他所在的大学做访问研究,3篇文章正在审阅中。在他的领导下,举办了“精准医学与贝叶斯统计”全国青年学者培训班,效果良好!今年还成功申请了省级培训项目“基于精准医学大数据”,该项目拟于今年8月4-5号举行。

易能君教授首先向我们介绍了microbiota和microbiome的概念,前者是指微生物群,后者是指微生物菌群的基因组。而我们所关注的是宿主的基因组或环境与microbiome的相互作用。目前已有部分文献表明微生物群与宿主健康存在相关关系。Microbiome数据因实验设计不同而具有一些特殊性质,如过离散性、总测量数不齐同、零数据膨胀、数据高维。microbiome数据来自于相互关联的个体,所得到的数据大多都是纵向数据,也有来自同一个体不同部位的重复测量值等等,这些相关的个体间microbiome数据相似度比独立个体大的多,如果直接忽略这些相关性,所得到的推断会产生偏移甚至会产生完全错误的结果。因此,接下来,易教授向大家介绍了几种统计分析方法,包括线性模型(LM)、混合线性模型(LMM)、负二项模型(NB)、负二项混合模型(NBMM)、零膨胀高斯混合模型(ZIGMM)以及零膨胀负二项混合模型(ZINBMM),通过模拟数据和真实数据集,结果发现NBMM比LMM能获得更小的p值,获得具有显著意义特征的能力也比LMM强。NB和ZINB模型比较灵活、稳健。最后,易教授向我们介绍了分析microbiome数据的R包,如BhGLM、nlme、lmer4、glm.nb() in MASS等。
现场的气氛轻松愉悦,与会的老师和同学们都听的十分认真。讲座结束后,师生与易能君教授就数据的结构类型以及各种模型的选择等问题进行了更加深入的讨论。
近两个小时的报告和交流让师生收获颇丰,学术讲座在愉快的气氛中结束!
公共卫生学院
2016年7月4日