计算机技术与发展2020,Vol.30Issue(12) :136-141.DOI:10.3969/j.issn.1673-629X.2020.12.024

基于混合特征的电影评分预测系统

Film Rating Prediction System Based on Mixed Features

黄东晋 耿晓云 李娜 丁友东
计算机技术与发展2020,Vol.30Issue(12) :136-141.DOI:10.3969/j.issn.1673-629X.2020.12.024

基于混合特征的电影评分预测系统

Film Rating Prediction System Based on Mixed Features

黄东晋 1耿晓云 1李娜 1丁友东1
扫码查看

作者信息

  • 1. 上海大学,上海 200072
  • 折叠

摘要

电影评分是衡量一部电影优劣的重要标准,对于投资商和观影者极具参考价值,因此电影评分的预测成为电影领域的研究热点.然而目前的评分预测系统由于特征信息不足,特征工程处理方法过于简单,机器学习算法较为单一,所以预测误差偏大.针对这一问题,结合自然语言处理技术提出一种基于混合特征的预测模型,并应用到电影评分预测系统中.数据集来源是某常用电影网站,同时为了获取更好的训练数据,需要对电影特征信息进行复杂的特征工程处理.利用训练完成的Bert模型矢量化电影数据集中的文本信息得到文本矢量特征,并采用支持向量机(SVM)算法初步训练预测评分.将该评分作为一维新特征和电影特征信息一起通过随机森林(random forest)算法训练预测最终评分.实验结果表明,该预测模型是可行的,预测值与真实值的误差较小,准确性显著提升.

关键词

电影评分预测/机器学习/自然语言处理/文本矢量特征/Bert

引用本文复制引用

基金项目

国家自然科学基金(61402278)

上海市自然科学基金(19ZR1419100)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量4
段落导航相关论文