基于语句分类模型的《红楼梦》作者探析

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据
维普

中文摘要：为了解决传统统计学方法在处理《红楼梦》作者存疑问题上对《红楼梦》文本人为提取片面、繁琐等缺点,基于改进的语句分类模型,利用Word2vec技术对字做词向量,通过文本卷积提取文本特征,在《红楼梦》120章回中从25章回开始,之后每隔5章回找出15个章回分割点,训练出15个语句分类模型,并验证和测试准确率分析模型.研究发现,《红楼梦》80章回处模型的验证和测试准确率异常高于其它章回分割点,改进的语句分类模型在准确度上提升3.6％.改进的语句分类模型解决了人为特征提取的不足,同时也推断《红楼梦》前80回与后40回不为同一人所写,为佐证其他作者存疑作品提供了新的思路和方法.

外文标题：Auther Identification of A Dream of Red Mansions Based on Sentence Classification Model

作者：

秦贵秋、顾长贵

展开 >

作者单位：

上海理工大学管理学院,上海200093

关键词：

《红楼梦》语句分类 Word2vec 词向量

基金：

项目编号：

11875042

出版年：

2021

DOI：

10.11907/rjdk.201762

软件导刊

湖北省信息学会

软件导刊

影响因子：0.524

ISSN：1672-7800

年,卷(期)：2021.20(4)

参考文献量7