基于朴素贝叶斯与BP网络神经分类方法的《红楼梦》文本特征差异研究
王阳阳
2018
发表期刊统计与决策
期号13页码:121-125
摘要《红楼梦》的作者问题一直是红学研究的热点。本文运用R语言对《红楼梦》著作进行文本分词和词频统计,从高频词汇和虚字两个研究角度分析《红楼梦》前八十回与后四十回文本特征的差异性。从高频词汇角度,通过制作分组高频词汇频数折线图,分析折线图的波动,初步表明《红楼梦》前八十回和后四十回文本特征存在差异;从虚字角度,通过监督学习方法中的朴素贝叶斯与BP神经网络,以虚字作为文本特征对《红楼梦》一百二十回作分类处理,并计算分类准确率,研究表明《红楼梦》前八十回和后四十回文本特征存在显著的差异。研究结果表明:《红楼梦》前八十回和后四十回作者不是同一个人。
关键词文本分析 朴素贝叶斯 BP神经网络 红学
DOI10.13546/j.cnki.tjyjc.2018.13.027
URL查看原文
收录类别CSSCI
ISSN1002-6487
语种中文
文献类型期刊论文
条目标识符http://ir.lzufe.edu.cn/handle/39EH0E1M/11600
专题统计与数据科学学院
作者单位兰州财经大学统计学院
第一作者单位统计与数据科学学院
推荐引用方式
GB/T 7714
王阳阳. 基于朴素贝叶斯与BP网络神经分类方法的《红楼梦》文本特征差异研究[J]. 统计与决策,2018(13):121-125.
APA 王阳阳.(2018).基于朴素贝叶斯与BP网络神经分类方法的《红楼梦》文本特征差异研究.统计与决策(13),121-125.
MLA 王阳阳."基于朴素贝叶斯与BP网络神经分类方法的《红楼梦》文本特征差异研究".统计与决策 .13(2018):121-125.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
28416.pdf(1734KB)期刊论文出版稿暂不开放CC BY-NC-SA请求全文
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[王阳阳]的文章
百度学术
百度学术中相似的文章
[王阳阳]的文章
必应学术
必应学术中相似的文章
[王阳阳]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。