首页|基于正则表达式的HTML信息提取

基于正则表达式的HTML信息提取

The HTML Information Extraction Based on Regular Expressions

扫码查看
在实际应用中经常需要分析Web页面的源代码,对HTML标记进行分析提取有用的数据.研究了如何利用正则表达式获取常见的HTML标记内容,实现了对HTML信息的定制提取,并以如何抓取一个学生成绩表的数据信息为例介绍了其实现过程.

李文华、杨亚仿、吴昊

展开 >

长江大学计算机科学学院,湖北荆州434023

正则表达式 HTML 信息提取

2012

电脑开发与应用
中国北方自动控制技术研究所

电脑开发与应用

影响因子:0.265
ISSN:1003-5850
年,卷(期):2012.25(4)
  • 4
  • 3