首页|基于LDA模型的在线健康社区信息主题特征及情感分类研究--以“百度痛风病吧”为例

基于LDA模型的在线健康社区信息主题特征及情感分类研究--以“百度痛风病吧”为例

卢畅

基于LDA模型的在线健康社区信息主题特征及情感分类研究--以“百度痛风病吧”为例

卢畅1
扫码查看

作者信息

  • 1. 上海应用技术大学
  • 折叠

摘要

“互联网+医疗健康”环境下,在线健康社区作为现代医疗信息获取和交互的新型平台,逐渐成为医疗行业健康信息互联互通的关键节点。在线健康社区正处于在线医疗服务行业的革新阶段,社区的信息数据庞大错综且异构多源,用户的情感需求日益迫切。因而,准确把握在线健康社区信息交互主题,研究社区的信息主题特征及其变化趋势,剖析用户之间的情感诉求,进一步挖掘潜在的信息价值,对优化在线健康社区信息主题分类和管理具有重要意义,有助于落实“互联网+医疗健康”政策和改善民众在线诊疗的服务质量。 本研究通过对“百度痛风病吧”在线健康社区进行主题特征的分析,构建主题分类和情感分类模型,探究社区用户的信息主题特征和情感偏好。首先,通过设计多线程爬虫代码,爬取在线健康社区帖子及跟帖的文本数据,经数据清洗和预处理后得到在线健康社区的基础文本语料库。其次,基于贴吧语料库构建 LDA 主题特征模型,运用不同的可视化方法探究在线健康社区的主题特征分布及其演化趋势。最后,运用机器学习的方法对得到的文本语料进行情感分类,分别研究正负向语料的信息主题特征结果。 研究结果表明,在线健康社区信息包含生活习惯、药物治疗、疾病诊疗、病理知识和情感支持五大主题特征类,社区用户信息交互的热门主题形成以药物治疗为主体、其他四种主题类协同并行的信息交互格局。其中,药物治疗类信息需求呈缓慢上升的趋势,疾病诊疗和生活习惯类信息需求显现出下降趋势,情感支持类和病理知识类信息需求经小幅度起伏后趋于平稳状态。另外,在线健康社区信息情感分类中,以中性情感语料为主,其后依次为正向情感和负向情感语料。最后,根据研究结果提出以下三个方面的建议:1.深化在线健康社区的信息体系建设;2.实时关注并跟进社区用户的情感需求;3.健全慢性病的医疗制度体系。

关键词

在线健康社区/信息主题特征/情感分类/LDA模型

引用本文复制引用

授予学位

硕士

学科专业

管理科学与工程

导师

于本海

学位年度

2023

学位授予单位

上海应用技术大学

语种

中文

中图分类号

TP
段落导航相关论文