基于随机化适应性Lasso的高维变量选择
闫懋博1,2; 田茂再3,4,5,6
2021
发表期刊统计研究
期号1页码:147-160
摘要Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p》n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性Lasso时构建选择事件的条件分布并剔除系数不显著的变量,以得到最终估计结果。本文的创新点在于提出的方法突破了适应性Lasso可选变量数的限制,当观测数据含有大量干扰变量时能够有效地识别出真实变量与干扰变量。与现有的惩罚变量选择方法相比,多种情境下的模拟研究展示了所提方法在上述两个问题中的优越性。实证研究中对NCI-60癌症细胞系数据进行了分析,结果较以往文献有明显改善。
关键词随机化适应性Lasso 高维变量选择 选择性推断
URL查看原文
ISSN1002-4565
语种中文
中图分类号O212.1
来源期刊等级B类
文献类型期刊论文
条目标识符http://ir.lzufe.edu.cn/handle/39EH0E1M/24369
专题统计与数据科学学院
作者单位1.山东财经大学统计学院;
2.中国人民大学统计学院;
3.新疆财经大学;
4.兰州财经大学;
5.教育部人文社会科学重点研究基地中国人民大学应用统计科学研究中心;
6.中国人民大学
第一作者单位统计与数据科学学院
推荐引用方式
GB/T 7714
闫懋博,田茂再. 基于随机化适应性Lasso的高维变量选择[J]. 统计研究,2021(1):147-160.
APA 闫懋博,&田茂再.(2021).基于随机化适应性Lasso的高维变量选择.统计研究(1),147-160.
MLA 闫懋博,et al."基于随机化适应性Lasso的高维变量选择".统计研究 .1(2021):147-160.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[闫懋博]的文章
[田茂再]的文章
百度学术
百度学术中相似的文章
[闫懋博]的文章
[田茂再]的文章
必应学术
必应学术中相似的文章
[闫懋博]的文章
[田茂再]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。