国家学术搜索
登录
注册
中文
EN
首页
|
网页信息表格化提取程序
网页信息表格化提取程序
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
本文介绍了基于MSHTML设计开发的网页信息表格化提取程序的原理、程序结构和工作流程,使用网页信息提取、网页元素解析、采集配置管理三大功能模块,实现对网页及其内部关联信息的提取、解析、整理和表格化显示,创新使用了对网页属性值和树路径值进行确认的二元检查机制,能够实现对指定信息的准确提取.本文还举例说明了程序的操作步骤和实际效果.
收起全部
展开查看外文信息
作者:
罗锦才
展开 >
作者单位:
厦门大学航空航天学院 福建 厦门 361005
关键词:
MSHTML
信息自动提取
网页元素属性
表格化显示
出版年:
2017
课程教育研究
中国外语学习学研究会
课程教育研究
影响因子:
0.181
ISSN:
2095-3089
年,卷(期):
2017.
(10)
参考文献量
5