首页|基于网络文本挖掘的游客满意度研究--以内蒙古景区为例

基于网络文本挖掘的游客满意度研究--以内蒙古景区为例

张璇

基于网络文本挖掘的游客满意度研究--以内蒙古景区为例

张璇1
扫码查看

作者信息

  • 1. 山东大学
  • 折叠

摘要

随着我国居民生活水平逐渐提高,旅游已经成为越来越热门的话题。内蒙古地区旅游资源丰富,常年居旅游话题榜前列,越来越多的游客选择在旅游服务平台上订购服务产品,由此产生了大量的用户生成内容。研究在线评论可以找出影响游客满意度的因素,对提高游客满意度、推动景区发展具有重大意义,也为后疫情初期内蒙古景区快速恢复生机、预判游客旅游需求提供更多决策信息。本文通过文本挖掘求出影响内蒙古景区游客满意度的因素,并通过AHP层次分析法构建模糊综合评价指标体系求出各个指标层的满意度,最后结合百度指数从时空角度预测后疫情时期游客满意度。 首先,本文通过Python程序在携程网平台上爬取了内蒙古旅游在线评论文本数据共27385条,经过数据清洗、文本分词等操作完成语料库的文本预处理工作,得到有效评论19862条,并对文本评论数据进行基础分析以初步了解数据特点。然后,通过TF-IDF、TextRank高频词分析了解游客对内蒙古旅游各方面的关注度,并使用句法依存树分析词间关系,使用语义网络分析句段语义,并通过ROSTCM6软件进行语义网络可视化,分析影响因素之间的内在联系。接着,利用LDA主题模型挖掘评价指标体系主题词,在利用可视化的方法确定评论文本语料库的最优主题数后,得到了内蒙古旅游评论文本的主题和对应的特征词,发现内蒙古旅游在线评论主要包括了八个主题:景点景色、食宿交通、景区消费、旅游服务、游玩感受、再来意愿、疫情防控、环境氛围。 其次,通过查阅文献并结合文本挖掘结果,最终构建包含五个维度的内蒙古景区游客满意度指标体系,使用MATLAB软件,构建基于AHP层次分析法的模糊综合评价指标体系对游客满意度进行评分,结果显示影响内蒙古景区游客满意度的五个维度按照重要程度排序为:景区景点、参观游玩、服务质量、旅游体验、疫情影响。内蒙古景区游客满意度整体评价得分为4.472,介于超棒与满意之间,从整体情况上来看,游客对内蒙古的满意度评价是偏高的。 最后,使用IPA分析法构建“重要性-满意度”二维四象限方格图,分析得到目前景区急需改进的方面有:景点消费、游玩服务、观览体验。为了能让内蒙古景区在疫情开放后初期快速恢复生机,本文基于百度指数从时空角度分析了游客对于内蒙古景区的关注度,发现内蒙古景区游客旅游存在明显的季节波动性,客源地存在明显的地理集中性,因此使用多元LSTM模型预测游客对景区的满意度,模型整体MSE为0.22,模型表现良好,预测结果显示,4月至6月游客整体满意度为4.648,相较于疫情期间的游客满意度呈小幅度上升趋势。

关键词

文本挖掘/在线评论/游客满意度/模糊综合评价/LSTM

引用本文复制引用

授予学位

硕士

学科专业

应用统计

导师

李蔚郁;林路

学位年度

2023

学位授予单位

山东大学

语种

中文

中图分类号

TP
段落导航相关论文