国家学术搜索
登录
注册
中文
EN
首页
|
基于正则表达式的HTML信息提取
基于正则表达式的HTML信息提取
The HTML Information Extraction Based on Regular Expressions
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
维普
万方数据
中文摘要:
在实际应用中经常需要分析Web页面的源代码,对HTML标记进行分析提取有用的数据.研究了如何利用正则表达式获取常见的HTML标记内容,实现了对HTML信息的定制提取,并以如何抓取一个学生成绩表的数据信息为例介绍了其实现过程.
收起全部
展开查看外文信息
作者:
李文华、杨亚仿、吴昊
展开 >
作者单位:
长江大学计算机科学学院,湖北荆州434023
关键词:
正则表达式
HTML
信息提取
出版年:
2012
电脑开发与应用
中国北方自动控制技术研究所
电脑开发与应用
影响因子:
0.265
ISSN:
1003-5850
年,卷(期):
2012.
25
(4)
被引量
4
参考文献量
3