基于密度峰值的随机森林自训练算法
刘伟; 顾振辉
2021-08-10
发表期刊信息与电脑(理论版)
卷号33期号:15页码:73-75
摘要在数据分析中,有标签数据难以获取且代价高昂、无标记数据往往大量易获得,而半监督学习在这种受限情况下可以大幅降低模型训练成本。笔者提出一种基于密度峰值的随机森林自训练算法,通过对单棵决策树进行自训练改进,利用密度峰值聚类算法获取样本潜在空间结构,在有标签样本中搜索邻近的样本,选择高置信度的无标签样本加入训练集,然后迭代优化分类器。该方法既保留了随机森林的泛化能力,又有效利用了无标签样本中的潜在信息。在多个UCI数据集中的实验结果表明,该算法能够提升半监督分类性能。
关键词自训练算法 密度峰值聚类 随机森林 半监督分类
URL查看原文
ISSN1003-9767
语种中文
原始文献类型学术期刊
中图分类号TP181
文献类型期刊论文
条目标识符http://ir.lzufe.edu.cn/handle/39EH0E1M/31256
专题信息工程与人工智能学院
作者单位兰州财经大学
第一作者单位兰州财经大学
推荐引用方式
GB/T 7714
刘伟,顾振辉. 基于密度峰值的随机森林自训练算法[J]. 信息与电脑(理论版),2021,33(15):73-75.
APA 刘伟,&顾振辉.(2021).基于密度峰值的随机森林自训练算法.信息与电脑(理论版),33(15),73-75.
MLA 刘伟,et al."基于密度峰值的随机森林自训练算法".信息与电脑(理论版) 33.15(2021):73-75.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[刘伟]的文章
[顾振辉]的文章
百度学术
百度学术中相似的文章
[刘伟]的文章
[顾振辉]的文章
必应学术
必应学术中相似的文章
[刘伟]的文章
[顾振辉]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。