曹丹丹 报道
4月24日下午,美国威斯康辛麦迪逊大学统计系邵军教授应邀为统计学科研究生及导师开展主题为“A GMM approach in coupling internal data and external summary information with heterogeneous data”的学术讲座。讲座在位育楼417举行,由澳门8858cc永利副经理汪红霞副教授主持。
邵军教授,是国际数理统计学会及美国统计学会的会士(Fellow),国际泛华统计学会主席。2005-2009任威斯康大学统计系主任,现为华东师范大学特聘教授。曾任JASA、StatisticaSinica副主编,Journal of Multivariate Analysis和Sankhya联合主编,现任Journal of Nonparametric Statistics主编,Journal of System Science and Complexity联合主编。主要研究方向是刀切法、自助法等重抽样,高维数据变量选择,缺失数据,纵向数据等。发表论文180多篇,出版专著6本。
在报告中,邵军教授首先介绍了内部数据与外部数据的区别,提出随着数据收集的进步,有机会可以充分利用外部数据进行统计分析。随后针对已有文献中提出的内部数据和外部数据的分布相同、基于参数模型的似然方法分析外部数据两个基本假设,分别进行改进。针对参数模型假设,提出应用统计推断的广义估计方程(GEE)方法,此方法是非参数或半参数,在原来只有内部数据形成的方程的基础上,将内部数据和外部数据进行耦合,形成额外的估计方程,进而应用广义矩方法(GMM)。对于内部数据和外部数据分布相同的假设,提出并不需要分布都相同,只需要Y给定X的条件分布以及X的分布在内部数据和外部数据相同,并证明了所提出的GMM估计量是渐近正态的,且比不使用外部数据的GEE估计更有效。最后,邵军教授通过两个模型模拟结果实验来验证所提出的方法,模拟结果证实了提出的理论。
互动环节中,周兴才教授与邵军教授就该报告中所提出的方法能否应用于高维数据等问题展开讨论,并期望在以后能有更加深入的学习与交流。通过本次讲座,与会师生均表示受益良多,对于外部数据与内部数据对统计分析与推断的作用有进一步认识。