国家学术搜索
登录
注册
中文
EN
首页
|
基于NLP的公众人物信息数据挖掘研究
基于NLP的公众人物信息数据挖掘研究
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
NLP指自然语言处理,将人类特有的语言转为结构化数据,是数据挖掘中人机交互的基础.本文以公众人物的公开文本信息为数据集,基于NLP自然语言处理的词向量及余弦相似度,主要对相近职业、月亮星座和地理位置3个维度展开浅层分析.为初步建立画像特征,挖掘步骤分为数据探索、爬虫采集和数据预处理,数据量级、颗粒度、泛化和评估仍有待优化.
收起全部
展开查看外文信息
作者:
黄莉
展开 >
作者单位:
中国人民大学(深圳校区),广东 深圳518000
关键词:
数据
维度
NLP
出版年:
2020
中国管理信息化
吉林科学技术出版社
中国管理信息化
CHSSCD
影响因子:
0.446
ISSN:
1673-0194
年,卷(期):
2020.
23
(8)
参考文献量
2