中国管理信息化2020,Vol.23Issue(8) :182-183.

基于NLP的公众人物信息数据挖掘研究

黄莉
中国管理信息化2020,Vol.23Issue(8) :182-183.

基于NLP的公众人物信息数据挖掘研究

黄莉1
扫码查看

作者信息

  • 1. 中国人民大学(深圳校区),广东 深圳518000
  • 折叠

摘要

NLP指自然语言处理,将人类特有的语言转为结构化数据,是数据挖掘中人机交互的基础.本文以公众人物的公开文本信息为数据集,基于NLP自然语言处理的词向量及余弦相似度,主要对相近职业、月亮星座和地理位置3个维度展开浅层分析.为初步建立画像特征,挖掘步骤分为数据探索、爬虫采集和数据预处理,数据量级、颗粒度、泛化和评估仍有待优化.

关键词

数据/维度/NLP

引用本文复制引用

出版年

2020
中国管理信息化
吉林科学技术出版社

中国管理信息化

CHSSCD
影响因子:0.446
ISSN:1673-0194
参考文献量2
段落导航相关论文