首页|基于语句分类模型的《红楼梦》作者探析

基于语句分类模型的《红楼梦》作者探析

扫码查看
为了解决传统统计学方法在处理《红楼梦》作者存疑问题上对《红楼梦》文本人为提取片面、繁琐等缺点,基于改进的语句分类模型,利用Word2vec技术对字做词向量,通过文本卷积提取文本特征,在《红楼梦》120章回中从25章回开始,之后每隔5章回找出15个章回分割点,训练出15个语句分类模型,并验证和测试准确率分析模型.研究发现,《红楼梦》80章回处模型的验证和测试准确率异常高于其它章回分割点,改进的语句分类模型在准确度上提升3.6%.改进的语句分类模型解决了人为特征提取的不足,同时也推断《红楼梦》前80回与后40回不为同一人所写,为佐证其他作者存疑作品提供了新的思路和方法.
Auther Identification of A Dream of Red Mansions Based on Sentence Classification Model

秦贵秋、顾长贵

展开 >

上海理工大学管理学院,上海200093

《红楼梦》 语句分类 Word2vec 词向量

11875042

2021

软件导刊
湖北省信息学会

软件导刊

影响因子:0.524
ISSN:1672-7800
年,卷(期):2021.20(4)
  • 7