国家学术搜索
登录
注册
中文
EN
首页
|
数据抽取中噪音过滤应用研究
数据抽取中噪音过滤应用研究
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
在数据抽取中,网页中噪音数据的处理是关键的第一步。针对噪音数据类型以及它们在网页中的位置,采取利用启发式规则和基于文本内容方法两种策略分步对噪音数据区域过滤,使用kNN文本分类算法进一步对列表页中的非用户关注栏目过滤。
收起全部
展开查看外文信息
作者:
郭东峰
展开 >
作者单位:
新乡学院 计算机与信息工程学院,河南 新乡 453000
关键词:
噪音
过滤
kNN分类算法
出版年:
2014
网友世界·云教育
中国电子学会
网友世界·云教育
ISSN:
1671-7074
年,卷(期):
2014.
(6)
参考文献量
3