网友世界·云教育2014,Issue(6) :22-22.

数据抽取中噪音过滤应用研究

郭东峰
网友世界·云教育2014,Issue(6) :22-22.

数据抽取中噪音过滤应用研究

郭东峰1
扫码查看

作者信息

  • 1. 新乡学院 计算机与信息工程学院,河南 新乡 453000
  • 折叠

摘要

在数据抽取中,网页中噪音数据的处理是关键的第一步。针对噪音数据类型以及它们在网页中的位置,采取利用启发式规则和基于文本内容方法两种策略分步对噪音数据区域过滤,使用kNN文本分类算法进一步对列表页中的非用户关注栏目过滤。

关键词

噪音/过滤/kNN分类算法

引用本文复制引用

出版年

2014
网友世界·云教育
中国电子学会

网友世界·云教育

ISSN:1671-7074
参考文献量3
段落导航相关论文