基于正则表达式的HTML信息提取

国家学术搜索

首页|基于正则表达式的HTML信息提取

基于正则表达式的HTML信息提取

The HTML Information Extraction Based on Regular Expressions

扫码查看

原文链接

NETL
NSTL
维普
万方数据

中文摘要：在实际应用中经常需要分析Web页面的源代码,对HTML标记进行分析提取有用的数据.研究了如何利用正则表达式获取常见的HTML标记内容,实现了对HTML信息的定制提取,并以如何抓取一个学生成绩表的数据信息为例介绍了其实现过程.

作者：

李文华、杨亚仿、吴昊

展开 >

作者单位：

长江大学计算机科学学院,湖北荆州434023

关键词：

正则表达式 HTML 信息提取

出版年：

2012

电脑开发与应用

中国北方自动控制技术研究所

电脑开发与应用

影响因子：0.265

ISSN：1003-5850

年,卷(期)：2012.25(4)

被引量4
参考文献量3