随着经济快速发展,旅游人数迅速增长,越来越多的人愿意在网络上分享自己对旅游景区的观点,因此各大旅游网站的景区评论成了许多人了解景区的重要信息来源.文章从美团网和携程网中爬取秦皇岛四个知名景区的评论数据,利用Python的第三方库对数据进行处理,得到有效评论数据,再进行情感分析,得到每条评论的情感得分.根据情感得分,把评论分为正面、负面两大类,对两类数据分别进行分词和词频统计,制作词云图,突出景区特色和不足.同时对各景区评论数据进行LDA主题词提取,提取结果与词云图结果相互印证.最后根据情感分析得出结论,为游客选择游玩地和景区整改提供建议.