新闻中心

科技之光︱公共卫生学院王彤教授团队提出适用于高维自变量的广义倾向性评分方法

来源:山西医科大学  2021-08-30 09:13:05   464 阅读

近日,我校公共卫生学院卫生统计学教研室王彤教授团队在生物信息学top期刊《Briefings in Bioinformatics》(IF=11.622)上发表了题为“High-dimensional generalized propensity score with application to omics data”的研究论文。该研究提出了高维自变量和连续型处理变量同时存在时的一种因果推断方法,第一作者为王彤教授指导的博士高倩。



在非随机化研究中,广义倾向性评分方法(Generalized Propensity Score,GPS)常用于校正已测量的混杂变量,以期获得连续型暴露因素与结局间的因果剂量反应关系。GPS方法得出因果结论需要满足不存在未测量混杂假设,这一假设无法检验,一般认为考虑的协变量越多越合理。然而,因果参数的估计值对GPS模型中纳入的协变量比较敏感,纳入不必要的协变量会导致估计准确度和精度下降。随着对组学数据和电子医疗病例数据等大数据的广泛使用,不存在未测量混杂这一假设成立的可能性变大,但也引入了高维自变量。在这种情况下,如何使用GPS方法得到因果参数的无偏估计值是一个亟待解决的问题。为此,王彤教授课题组提出了广义结局自适应LASSO(Generalized Outcome-adaptive LASSO,GOAL)方法。



GOAL方法通过双重加权相关系数(dual-weight correlation,DWC)将结局自适应LASSO(Outcome-Adaptive LASSO,OAL)方法和非参数协变量均衡广义倾向性评分方法(Nonparametric Covariate Balancing Generalized Propensity Score, npCBGPS)结合,分三步完成。首先借用OAL的思想构建新的目标函数实现变量选择;随后基于选出的变量使用npCBGPS方法计算权重和DWC,并使用最小DWC准则确定调整参数的最优值;最后使用边际结构模型方法估计因果参数。模拟研究表明,GOAL方法各方面的表现与理想方法相近甚至在某些情况下表现略优。该方法一方面保留了OAL方法正确识别校正协变量的能力,另一方面继承了npCBGPS方法对GPS模型误设稳健的统计学性质,同时还克服了二者在实际应用中的局限性。最后,该研究使用GOAL方法利用多脑区多数据集探讨了表观衰老加速与阿尔兹海默病发病间的剂量反应关系,阐明了GOAL方法的应用步骤以及在实际研究中需要注意的问题。GOAL方法的提出为现实世界研究中高维自变量和连续型处理变量同时存在时的因果效应无偏估计提供了新思路。

【免责申明】本专题图片均来源于学校官网或互联网,若有侵权请联系400-0815-589删除。