Institutional Repository of School of Statistics
基于横截面和纵向信息的函数型多重插补方法 | |
其他题名 | Functional Multiple Imputation Method Based on Cross-sectional and Longitudinal Information |
高海燕1,2![]() ![]() | |
2025-03-13 | |
发表期刊 | 统计与决策
![]() |
卷号 | 41期号:05页码:37-42 |
摘要 | 函数型数据是一类复杂的非线性结构数据,往往以函数(曲线)的形式呈现和储存,但在数据收集过程中不可避免地会出现数据缺失的情况。文章提出了一种基于横截面和纵向信息的函数型多重插补方法(Missforest Combining Gaussian Processes,MFGP)。该方法受集成模型的启发,通过将基于缺失森林模型(MF)的插补与基于高斯过程(GP)的预测相结合,有效整合了函数型数据的横截面信息和纵向信息,进而提高了插补精度。同时,模拟数据插补实验和股票数据实例分析结果表明:在5%~55%的缺失比例下,MFGP的插补效果优于均值插补、Hot.deck、SFI、HFI、MICE、MF和GP这7种插补方法,具有显著的插补优势,且插补得到的数据与原始数据的规律更相符。 |
其他摘要 | Functional data is a type of complex nonlinear structured data,which is often presented and stored in the form of functions(curves).However,in the process of data collection,missing data is inevitable.This paper proposes a Missforest Combin-ing Gaussian Processes(MFGP)method based on cross-sectional and longitudinal information.Inspired by the ensemble models,the method integrates imputation based on Missforest model(MF)with prediction based on Gaussian processes(GP),effectively in-tegrates cross-sectional and longitudinal information of functional data to enhance imputation accuracy.Meanwhile,the results of simulation data interpolation experiment and stock data example analysis show that under the missing ratio of 5%to 55%,MFGP has a significant imputation advantage over seven other imputation methods,namely mean imputation,Hot.deck,SFI,HFI,MICE,MF and GP,and the obtained data is more consistent with the original data. |
关键词 | 机器学习 缺失数据 多重插补 集成模型 |
DOI | 10.13546/j.cnki.tjyjc.2025.05.006 |
URL | 查看原文 |
收录类别 | 北大核心 ; 中国科技核心期刊 ; CSSCI ; AMI |
ISSN | 1002-6487 |
语种 | 中文 |
原始文献类型 | 学术期刊 |
中图分类号 | O212.1 |
CN号 | 42-1009/C |
文献类型 | 期刊论文 |
条目标识符 | http://ir.lzufe.edu.cn/handle/39EH0E1M/38823 |
专题 | 统计与数据科学学院 |
作者单位 | 1.兰州财经大学统计与数据科学学院; 2.兰州财经大学甘肃省数字经济与社会计算科学重点实验室 |
第一作者单位 | 统计与数据科学学院; 兰州财经大学 |
推荐引用方式 GB/T 7714 | 高海燕,李唯欣. 基于横截面和纵向信息的函数型多重插补方法[J]. 统计与决策,2025,41(05):37-42. |
APA | 高海燕,&李唯欣.(2025).基于横截面和纵向信息的函数型多重插补方法.统计与决策,41(05),37-42. |
MLA | 高海燕,et al."基于横截面和纵向信息的函数型多重插补方法".统计与决策 41.05(2025):37-42. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[高海燕]的文章 |
[李唯欣]的文章 |
百度学术 |
百度学术中相似的文章 |
[高海燕]的文章 |
[李唯欣]的文章 |
必应学术 |
必应学术中相似的文章 |
[高海燕]的文章 |
[李唯欣]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论