首页|基于NLP的公众人物信息数据挖掘研究

基于NLP的公众人物信息数据挖掘研究

扫码查看
NLP指自然语言处理,将人类特有的语言转为结构化数据,是数据挖掘中人机交互的基础.本文以公众人物的公开文本信息为数据集,基于NLP自然语言处理的词向量及余弦相似度,主要对相近职业、月亮星座和地理位置3个维度展开浅层分析.为初步建立画像特征,挖掘步骤分为数据探索、爬虫采集和数据预处理,数据量级、颗粒度、泛化和评估仍有待优化.

黄莉

展开 >

中国人民大学(深圳校区),广东 深圳518000

数据 维度 NLP

2020

中国管理信息化
吉林科学技术出版社

中国管理信息化

CHSSCD
影响因子:0.446
ISSN:1673-0194
年,卷(期):2020.23(8)
  • 2