摘要
社交媒体极大地丰富了人们的生活,人们一方面逐渐依赖社交媒体来了解外界动态,另一方面社交媒体也作为人类器官的延伸,帮助人们发出更广泛的声音,人们越来越习惯于在上面发表自身的观点,社交网络上因此存储了海量的评价信息。公共交通研究机构长期以来依赖传统的调查问卷来量化公共交通服务质量,这种方法存在参与积极性差、成本高、连续性不强的特点,引入新的调查方法以对问卷调查方法加以补充显得既有需要也有可能。本文应用自然语言处理方法,基于社交媒体视角对公共交通服务质量进行研究。 本文首先调研了交通评论相关的社交媒体,最终选取大众点评作为本文的研究数据源,应用网络爬虫分别抓取上海市不同公共交通类型的评论文本,并清洗无汉字字符评论、无效关键词评论、广告评论以及重复评论。而后应用基于朴素贝叶斯的情感分类,基于Gephi的共现分析以及基于TF-IDF的关键词抽取对评论文本进行了文本分析,通过较为直观的可视化形式,揭示了不同公共交通类型的共性和特性,反映了公众在不同情感倾向下的关注点,同时明确了将公众满意度最低的地面公交作为本文的研究重点。 其次对上海交通评论文本进行了“特征词-观点词”的抽取,建立了交通领域专有特征词表,并将提取到的特征词归类到八大公共交通服务质量评价指标中,应用层次分析法对指标划分权重,最终根据观点词的情感极性和指标权重综合计算各公交线路的服务质量得分。从得分结果来看,43路公交车服务质量最高,其优势在于出行成本和总体印象,对于服务质量得分较低的875路、66路、44路及941路,应重点关注发车频率和服务人员素质问题。 最后提出了分别针对公交运营部门、交通规划部门以及政府部门的对策建议,建议形成以社交媒体数据共享为基础的“主人翁(公交集团)-先行官(交通规划设计部门)-协调员(政府部门)”耦合系统,以提高公众的参与度以及公众对于公共交通服务的满意度。