数字化用户2019,Vol.25Issue(25) :254,256.

基于代理服务器的动态Web页面采集框架的设计

杜海涛
数字化用户2019,Vol.25Issue(25) :254,256.

基于代理服务器的动态Web页面采集框架的设计

杜海涛1
扫码查看

作者信息

  • 1. 214063 无锡商业职业技术学院 江苏 无锡
  • 折叠

摘要

随着信息技术的快速发展,越来越多的网站采用AJAX技术,常见的爬虫框架不能有效的抓取动态网页上的数据本文,本文提出一种基于代理服务器的动态Web页面采集框架,框架通过设置代理服务器,向动态网站中注入JS代码,在内置浏览器中执行JS脚本,实现各种预定义的操作,从而实现对动态网页的数据采集.

关键词

JavaScript/动态Web页面/采集框架/代理服务器

引用本文复制引用

出版年

2019
数字化用户

数字化用户

ISSN:
参考文献量2
段落导航相关论文