Institutional Repository of School of Statistics
基于朴素贝叶斯与BP网络神经分类方法的《红楼梦》文本特征差异研究 | |
王阳阳 | |
2018 | |
发表期刊 | 统计与决策 |
期号 | 13页码:121-125 |
摘要 | 《红楼梦》的作者问题一直是红学研究的热点。本文运用R语言对《红楼梦》著作进行文本分词和词频统计,从高频词汇和虚字两个研究角度分析《红楼梦》前八十回与后四十回文本特征的差异性。从高频词汇角度,通过制作分组高频词汇频数折线图,分析折线图的波动,初步表明《红楼梦》前八十回和后四十回文本特征存在差异;从虚字角度,通过监督学习方法中的朴素贝叶斯与BP神经网络,以虚字作为文本特征对《红楼梦》一百二十回作分类处理,并计算分类准确率,研究表明《红楼梦》前八十回和后四十回文本特征存在显著的差异。研究结果表明:《红楼梦》前八十回和后四十回作者不是同一个人。 |
关键词 | 文本分析 朴素贝叶斯 BP神经网络 红学 |
DOI | 10.13546/j.cnki.tjyjc.2018.13.027 |
URL | 查看原文 |
收录类别 | CSSCI |
ISSN | 1002-6487 |
语种 | 中文 |
文献类型 | 期刊论文 |
条目标识符 | http://ir.lzufe.edu.cn/handle/39EH0E1M/11600 |
专题 | 统计与数据科学学院 |
作者单位 | 兰州财经大学统计学院 |
第一作者单位 | 统计与数据科学学院 |
推荐引用方式 GB/T 7714 | 王阳阳. 基于朴素贝叶斯与BP网络神经分类方法的《红楼梦》文本特征差异研究[J]. 统计与决策,2018(13):121-125. |
APA | 王阳阳.(2018).基于朴素贝叶斯与BP网络神经分类方法的《红楼梦》文本特征差异研究.统计与决策(13),121-125. |
MLA | 王阳阳."基于朴素贝叶斯与BP网络神经分类方法的《红楼梦》文本特征差异研究".统计与决策 .13(2018):121-125. |
条目包含的文件 | ||||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
28416.pdf(1734KB) | 期刊论文 | 出版稿 | 暂不开放 | CC BY-NC-SA | 请求全文 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[王阳阳]的文章 |
百度学术 |
百度学术中相似的文章 |
[王阳阳]的文章 |
必应学术 |
必应学术中相似的文章 |
[王阳阳]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论