Institutional Repository of School of Information Engineering and Artificial Intelligence
基于密度峰值的随机森林自训练算法 | |
刘伟; 顾振辉 | |
2021-08-10 | |
发表期刊 | 信息与电脑(理论版) |
卷号 | 33期号:15页码:73-75 |
摘要 | 在数据分析中,有标签数据难以获取且代价高昂、无标记数据往往大量易获得,而半监督学习在这种受限情况下可以大幅降低模型训练成本。笔者提出一种基于密度峰值的随机森林自训练算法,通过对单棵决策树进行自训练改进,利用密度峰值聚类算法获取样本潜在空间结构,在有标签样本中搜索邻近的样本,选择高置信度的无标签样本加入训练集,然后迭代优化分类器。该方法既保留了随机森林的泛化能力,又有效利用了无标签样本中的潜在信息。在多个UCI数据集中的实验结果表明,该算法能够提升半监督分类性能。 |
关键词 | 自训练算法 密度峰值聚类 随机森林 半监督分类 |
URL | 查看原文 |
ISSN | 1003-9767 |
语种 | 中文 |
原始文献类型 | 学术期刊 |
中图分类号 | TP181 |
文献类型 | 期刊论文 |
条目标识符 | http://ir.lzufe.edu.cn/handle/39EH0E1M/31256 |
专题 | 信息工程与人工智能学院 |
作者单位 | 兰州财经大学 |
第一作者单位 | 兰州财经大学 |
推荐引用方式 GB/T 7714 | 刘伟,顾振辉. 基于密度峰值的随机森林自训练算法[J]. 信息与电脑(理论版),2021,33(15):73-75. |
APA | 刘伟,&顾振辉.(2021).基于密度峰值的随机森林自训练算法.信息与电脑(理论版),33(15),73-75. |
MLA | 刘伟,et al."基于密度峰值的随机森林自训练算法".信息与电脑(理论版) 33.15(2021):73-75. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[刘伟]的文章 |
[顾振辉]的文章 |
百度学术 |
百度学术中相似的文章 |
[刘伟]的文章 |
[顾振辉]的文章 |
必应学术 |
必应学术中相似的文章 |
[刘伟]的文章 |
[顾振辉]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论