首页|数据抽取中噪音过滤应用研究

数据抽取中噪音过滤应用研究

扫码查看
在数据抽取中,网页中噪音数据的处理是关键的第一步。针对噪音数据类型以及它们在网页中的位置,采取利用启发式规则和基于文本内容方法两种策略分步对噪音数据区域过滤,使用kNN文本分类算法进一步对列表页中的非用户关注栏目过滤。

郭东峰

展开 >

新乡学院 计算机与信息工程学院,河南 新乡 453000

噪音 过滤 kNN分类算法

2014

网友世界·云教育
中国电子学会

网友世界·云教育

ISSN:1671-7074
年,卷(期):2014.(6)
  • 3