国家学术搜索
登录
注册
中文
EN
首页
|
基于代理服务器的动态Web页面采集框架的设计
基于代理服务器的动态Web页面采集框架的设计
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
中文摘要:
随着信息技术的快速发展,越来越多的网站采用AJAX技术,常见的爬虫框架不能有效的抓取动态网页上的数据本文,本文提出一种基于代理服务器的动态Web页面采集框架,框架通过设置代理服务器,向动态网站中注入JS代码,在内置浏览器中执行JS脚本,实现各种预定义的操作,从而实现对动态网页的数据采集.
收起全部
展开查看外文信息
作者:
杜海涛
展开 >
作者单位:
214063 无锡商业职业技术学院 江苏 无锡
关键词:
JavaScript
动态Web页面
采集框架
代理服务器
出版年:
2019
数字化用户
数字化用户
ISSN:
年,卷(期):
2019.
25
(25)
参考文献量
2