作者王帅
姓名汉语拼音Wang Shuai
学号2018000003093
培养单位兰州财经大学
电话15562886230
电子邮件738641701@qq.com
入学年份2018-9
学位类别学术硕士
培养级别硕士研究生
学科门类理学
一级学科名称统计学
学科方向数理统计学
学科代码0714Z3
第一导师姓名艾明要
第一导师姓名汉语拼音Ai Mingyao
第一导师单位北京大学数学科学学院
第一导师职称教授
题名基于混合截断正态分布的分层贝叶斯分位数回归模型及变量选择
英文题名Hierarchical Bayesian quantile regression model and variable selection based on mixed truncated normal distribution
关键词贝叶斯惩罚分位数回归 Gibbs 抽样 Adaptive Elastic Net 混合截断正态分布
外文关键词Bayesian Regularized Quantile Regression ; Gibbs Sampling ; Adaptive Elastic Net ; Scale Mixtures Truncated Normal Distribution
摘要
    高维数据广泛存在于人们日常生活的各个领域,如社会经济、生物医学、信号处理等等。高维数据通常具有强相关性、数据维度高以及尖峰厚尾分布等特征。高维数据的建模分析也是现代统计学研究的热点和前沿问题。随着感兴趣变量的增多,选择对响应变量有显著影响且具有较强解释力的变量,提高联合模型的拟合精确度,是统计学中的变量选择问题。本论文研究了分层贝叶斯分位数回归模型在混合截断正态分布条件下的变量选择问题,并通过模拟计算对比分析了这种变量选择方法的优良效果。
    本论文在变量选择现有模型基础上,基于非对称 Laplace 分布的混合截断正态分布表达形式,提出了新的 Lasso、Adaptive Lasso、Elastic Net 和 Adaptive Elastic Net 分位数回归模型。论文通过贝叶斯分析方法,用 Gibbs 抽样得到了模型参数的后验分布,进而筛选出了响应的显著影响变量。论文通过数值模拟和真实数据分析,比较不同模型之间变量筛选的优缺点。模拟分析表明,存在大量预测因子、共线性和异质性等情况下,这种基于混合截断正态分布的贝叶斯Adaptive Elastic Net 分位数回归模型应用于变量选择时表现最佳。
英文摘要
    High-dimensional data is widely used in various fields of People's Daily life, such as social economy, biomedical science, signal processing and so on. High-dimensional data is usually characterized by strong correlation, high data dimension and sharp peak and thick tail distribution. Modeling and analysis of high-dimensional data is also a hot and frontier problem in modern statistical research. With the
increase of variables of interest, it is a variable selection problem in statistics to select the variables that have a significant influence on the response variables and have a strong explanatory power, so as to improve the fitting accuracy of the joint model. In this thesis, we study the variable selection problem of hierarchical Bayesian quantile regression model under the condition of mixed truncated normal distribution, and compare and analyze the excellent effect of this variable selection method through simulation
calculation.
    In this thesis, refer to the variable selection of existing models, and based on the expression form of mixed truncated normal distribution of asymmetric Laplace distribution, Lasso, Adaptive Lasso, Elastic Net and Adaptive Elastic Net quantile regression models are proposed. In this paper, the posterior distribution of model parameters is obtained by using the method of Bayesian analysis and Gibbs sampling, and the significant influencing variables of the response are screened out. Through numerical simulation and real data analysis, this thesis compares the advantages and disadvantages of variable screening among different models. The results show that this Bayesian Adaptive Elastic Net quantile regression model based on mixed truncated normal distribution performs best when applied to variable selection in the presence of a large number of predictors, collinearity and heterogeneity.

 

学位类型硕士
答辩日期2021-05
学位授予地点甘肃省兰州市
语种中文
论文总页数56
参考文献总数50
馆藏号0003539
保密级别内部
中图分类号O212/11
文献类型学位论文
条目标识符http://ir.lzufe.edu.cn/handle/39EH0E1M/29567
专题统计与数据科学学院
推荐引用方式
GB/T 7714
王帅. 基于混合截断正态分布的分层贝叶斯分位数回归模型及变量选择[D]. 甘肃省兰州市. 兰州财经大学,2021.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
王帅2018000003093基于混合截(891KB)学位论文 暂不开放CC BY-NC-SA请求全文
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[王帅]的文章
百度学术
百度学术中相似的文章
[王帅]的文章
必应学术
必应学术中相似的文章
[王帅]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。