多数据源冲突的主数据真值发现算法
王继奎; 李少波
2014-01-16
发表期刊计算机工程与设计
期号1页码:177-182
摘要为了解决多数据源冲突的主数据真值发现问题,基于对冲突数据值之间的支持度往往是非对称的直观认识,提出了一种非对称的数据值支持度计算算法;该算法改进了目前真值发现算法中以数据值之间的相似度代替支持度的对称算法。在考虑了数据值的可信度取决于数据源权威度和数据值支持度的基础上,提出了TRFinder迭代算法,并在TRFinder算法的基础上给出了主数据生成算法。通过对典型的books_authors数据集和模拟数据进行实验,实验结果表明,TRFinder算法比Vote算法与TruthFinder算法具有更高的准确率并保留了更多的真值信息,验证了算法的有效性。
关键词多数据源 真值发现 主数据集成 数据值支持度 数据冲突
DOI10.16208/j.issn1000-7024.2014.01.047
URL查看原文
收录类别北大核心 ; CSCD
ISSN1000-7024
语种中文
CSCD记录号CSCD:5046912
文献类型期刊论文
条目标识符http://ir.lzufe.edu.cn/handle/39EH0E1M/2208
专题信息工程与人工智能学院
作者单位1.中国科学院成都计算机应用研究所;
2.贵州大学现代制造技术教育部重点实验室;
3.兰州商学院信息工程学院
推荐引用方式
GB/T 7714
王继奎,李少波. 多数据源冲突的主数据真值发现算法[J]. 计算机工程与设计,2014(1):177-182.
APA 王继奎,&李少波.(2014).多数据源冲突的主数据真值发现算法.计算机工程与设计(1),177-182.
MLA 王继奎,et al."多数据源冲突的主数据真值发现算法".计算机工程与设计 .1(2014):177-182.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[王继奎]的文章
[李少波]的文章
百度学术
百度学术中相似的文章
[王继奎]的文章
[李少波]的文章
必应学术
必应学术中相似的文章
[王继奎]的文章
[李少波]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。