Institutional Repository of School of Statistics
作者 | 王帅 |
姓名汉语拼音 | Wang Shuai |
学号 | 2018000003093 |
培养单位 | 兰州财经大学 |
电话 | 15562886230 |
电子邮件 | 738641701@qq.com |
入学年份 | 2018-9 |
学位类别 | 学术硕士 |
培养级别 | 硕士研究生 |
学科门类 | 理学 |
一级学科名称 | 统计学 |
学科方向 | 数理统计学 |
学科代码 | 0714Z3 |
第一导师姓名 | 艾明要 |
第一导师姓名汉语拼音 | Ai Mingyao |
第一导师单位 | 北京大学数学科学学院 |
第一导师职称 | 教授 |
题名 | 基于混合截断正态分布的分层贝叶斯分位数回归模型及变量选择 |
英文题名 | Hierarchical Bayesian quantile regression model and variable selection based on mixed truncated normal distribution |
关键词 | 贝叶斯惩罚分位数回归 Gibbs 抽样 Adaptive Elastic Net 混合截断正态分布 |
外文关键词 | Bayesian Regularized Quantile Regression ; Gibbs Sampling ; Adaptive Elastic Net ; Scale Mixtures Truncated Normal Distribution |
摘要 | 高维数据广泛存在于人们日常生活的各个领域,如社会经济、生物医学、信号处理等等。高维数据通常具有强相关性、数据维度高以及尖峰厚尾分布等特征。高维数据的建模分析也是现代统计学研究的热点和前沿问题。随着感兴趣变量的增多,选择对响应变量有显著影响且具有较强解释力的变量,提高联合模型的拟合精确度,是统计学中的变量选择问题。本论文研究了分层贝叶斯分位数回归模型在混合截断正态分布条件下的变量选择问题,并通过模拟计算对比分析了这种变量选择方法的优良效果。
本论文在变量选择现有模型基础上,基于非对称 Laplace 分布的混合截断正态分布表达形式,提出了新的 Lasso、Adaptive Lasso、Elastic Net 和 Adaptive Elastic Net 分位数回归模型。论文通过贝叶斯分析方法,用 Gibbs 抽样得到了模型参数的后验分布,进而筛选出了响应的显著影响变量。论文通过数值模拟和真实数据分析,比较不同模型之间变量筛选的优缺点。模拟分析表明,存在大量预测因子、共线性和异质性等情况下,这种基于混合截断正态分布的贝叶斯Adaptive Elastic Net 分位数回归模型应用于变量选择时表现最佳。 |
英文摘要 | High-dimensional data is widely used in various fields of People's Daily life, such as social economy, biomedical science, signal processing and so on. High-dimensional data is usually characterized by strong correlation, high data dimension and sharp peak and thick tail distribution. Modeling and analysis of high-dimensional data is also a hot and frontier problem in modern statistical research. With the
increase of variables of interest, it is a variable selection problem in statistics to select the variables that have a significant influence on the response variables and have a strong explanatory power, so as to improve the fitting accuracy of the joint model. In this thesis, we study the variable selection problem of hierarchical Bayesian quantile regression model under the condition of mixed truncated normal distribution, and compare and analyze the excellent effect of this variable selection method through simulation
calculation.
In this thesis, refer to the variable selection of existing models, and based on the expression form of mixed truncated normal distribution of asymmetric Laplace distribution, Lasso, Adaptive Lasso, Elastic Net and Adaptive Elastic Net quantile regression models are proposed. In this paper, the posterior distribution of model parameters is obtained by using the method of Bayesian analysis and Gibbs sampling, and the significant influencing variables of the response are screened out. Through numerical simulation and real data analysis, this thesis compares the advantages and disadvantages of variable screening among different models. The results show that this Bayesian Adaptive Elastic Net quantile regression model based on mixed truncated normal distribution performs best when applied to variable selection in the presence of a large number of predictors, collinearity and heterogeneity.
|
学位类型 | 硕士 |
答辩日期 | 2021-05 |
学位授予地点 | 甘肃省兰州市 |
语种 | 中文 |
论文总页数 | 56 |
参考文献总数 | 50 |
馆藏号 | 0003539 |
保密级别 | 内部 |
中图分类号 | O212/11 |
文献类型 | 学位论文 |
条目标识符 | http://ir.lzufe.edu.cn/handle/39EH0E1M/29567 |
专题 | 统计与数据科学学院 |
推荐引用方式 GB/T 7714 | 王帅. 基于混合截断正态分布的分层贝叶斯分位数回归模型及变量选择[D]. 甘肃省兰州市. 兰州财经大学,2021. |
条目包含的文件 | ||||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
王帅2018000003093基于混合截(891KB) | 学位论文 | 暂不开放 | CC BY-NC-SA | 请求全文 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[王帅]的文章 |
百度学术 |
百度学术中相似的文章 |
[王帅]的文章 |
必应学术 |
必应学术中相似的文章 |
[王帅]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论