首页|基于代理服务器的动态Web页面采集框架的设计

基于代理服务器的动态Web页面采集框架的设计

扫码查看
随着信息技术的快速发展,越来越多的网站采用AJAX技术,常见的爬虫框架不能有效的抓取动态网页上的数据本文,本文提出一种基于代理服务器的动态Web页面采集框架,框架通过设置代理服务器,向动态网站中注入JS代码,在内置浏览器中执行JS脚本,实现各种预定义的操作,从而实现对动态网页的数据采集.

杜海涛

展开 >

214063 无锡商业职业技术学院 江苏 无锡

JavaScript 动态Web页面 采集框架 代理服务器

2019

数字化用户

数字化用户

ISSN:
年,卷(期):2019.25(25)
  • 2