作者邢晓文
姓名汉语拼音XingXiaowen
学号2021000003082
培养单位兰州财经大学
电话18338753986
电子邮件xingxw2021@163.com
入学年份2021-9
学位类别学术硕士
培养级别硕士研究生
学科门类理学
一级学科名称统计学
学科方向数理统计学
学科代码0714Z3
第一导师姓名牛成英
第一导师姓名汉语拼音NiuChengyin
第一导师单位兰州财经大学
第一导师职称教授
题名基于加权核范数矩阵填充的因果效应评价方法研究
英文题名Research on Causal Effect Evaluation Based on Weighted Kernel Norm Matrix Completion
关键词因果推断 矩阵填充 加权核范数 随机森林 倾向得分
外文关键词Causal inference ; Matrix completion ; Weighted kernel norm ; Random forest ; Propensity score
摘要

随着大数据科学发展以及因果推断相关研究的不断推进,从观察数据中发现 因果关系是各领域研究中的热点问题。在反事实因果效应估计框架下,潜在结果 的估计是关键问题。目前,随着机器学习功能变得越来越强大,越来越多的机器 学习算法融入因果推断方法中,利用矩阵填充方法填补缺失潜在结果已经被证实 是因果推断中一种有效方法。从矩阵填充角度出发,研究在因果推断中如何更好 的利用先验信息降低矩阵填充估计潜在结果的误差。主要研究内容包括以下几方 面:

(1)在不考虑协变量的情况下,填充目标变量的反事实结果。提出用自适应加 权核范数替代核范数的加权核范数矩阵填充方法,避免了较大奇异值过度惩罚的 情况,并根据交替方向乘子法(Alternating Direction Method of Multipliers,ADMM) 框架证明最优解以及收敛性。从数值模拟和真实数据实验结果来看,相较于传统 方法加权核范数模型预测缺失潜在结果精度更高。

(2)在考虑协变量的情况下,提出基于随机森林倾向得分加权矩阵填充的方 法,用随机森林模型估计倾向得分能有效避免传统倾向得分方法模型设定匹配结 果的平衡性,在此基础上,利用倾向得分匹配协变量平衡性质加权损失函数,使 得处理组和控制组之间具有可比性。从实验结果来看,随机森林倾向得分加权矩 阵填充模型估计潜在结果的误差更小,并估计出因果推断关注的平均处理效应。

英文摘要

With the development of big data science and the continuous advancement of research on causal inference, discovering causal relationships from observational data is a hot topic in various fields of research. Under the framework of counterfactual causal effect estimation, the estimation of potential outcomes is a key issue. Currently, as machine learning capabilities become increasingly powerful, more and more machine learning algorithms are being integrated into causal inference methods. The use of matrix completion methods to complete in missing potential outcomes has been proven to be an effective method in causal inference. This article starts from the perspective of matrix completion and studies how to better utilize prior information in causal inference in causal inference to reduce the error of potential outcomes in matrix completion estimation. The main research content includes the following aspects:

(1) Without considering covariates, complete the counterfactual results of the target variable. This article proposes a weighted kernel norm matrix completion method, which replaces the kernel norm with an adaptive weighted kernel norm to avoid excessive punishment for large singular values. The optimal solution and convergence are proven using the ADMM framework. From the results of numerical simulation and real data experiments, it can be seen that compared to traditional methods, weighted kernel norm models have higher accuracy in predicting potential missing outcomes.

(2) Taking into account covariates, this article proposes a method based on random forest propensity score weighted matrix completion model. Estimating propensity scores using a random forest model can effectively avoid the balance of matching outcomes model settings in traditional propensity score methods. Based on this, weighted loss function using propensity score covariate balance property to ensure comparability between treatment group and control group. From the experimental results, it can be seen that the random forest propensity score weighted matrix completion model has a smaller error in estimating potential outcomes and estimates the average treatment effect for the treated in causal inference.

 

学位类型硕士
答辩日期2024-05-25
学位授予地点甘肃省兰州市
语种中文
论文总页数62
参考文献总数72
馆藏号0005683
保密级别公开
中图分类号O212/41
文献类型学位论文
条目标识符http://ir.lzufe.edu.cn/handle/39EH0E1M/36991
专题统计与数据科学学院
推荐引用方式
GB/T 7714
邢晓文. 基于加权核范数矩阵填充的因果效应评价方法研究[D]. 甘肃省兰州市. 兰州财经大学,2024.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
2021000003082.pdf(1473KB)学位论文 开放获取CC BY-NC-SA浏览 下载
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[邢晓文]的文章
百度学术
百度学术中相似的文章
[邢晓文]的文章
必应学术
必应学术中相似的文章
[邢晓文]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 2021000003082.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。