国家学术搜索
登录
注册
中文
EN
文渊(中学版)
2020,
Issue
(7) :
598.
DOI:
10.12252/j.issn.2096-627X.2020.07.955
大数据治理中数据清洗方法的思考
陈世鹏
文渊(中学版)
2020,
Issue
(7) :
598.
DOI:
10.12252/j.issn.2096-627X.2020.07.955
引用
认领
✕
来源:
NETL
NSTL
万方数据
大数据治理中数据清洗方法的思考
陈世鹏
1
扫码查看
点击上方二维码区域,可以放大扫码查看
作者信息
1.
北京锐安科技有限公司 北京 100000
折叠
摘要
在各类大数据项目中,数据清洗是数据挖掘和应用的重要保障.脏数据会导致不可靠输出,如何高效去掉脏数据、提升数据质量、对异常数据进行修复是数据治理运营的重要环节.本文通过对数据质量问题及数据清洗方法的分析与总结,提出基于NLP算法对某类大数据行业的数据进行清洗和质量提升的方法.
关键词
数据清洗
/
NLP
/
数据质量
/
数据挖掘
引用本文
复制引用
出版年
2020
文渊(中学版)
文渊(中学版)
ISSN:
引用
认领
参考文献量
5
段落导航
相关论文
摘要
关键词
引用本文
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果