国家学术搜索
登录
注册
中文
EN
数字化用户
2019,
Vol.
25
Issue
(25) :
254,256.
基于代理服务器的动态Web页面采集框架的设计
杜海涛
数字化用户
2019,
Vol.
25
Issue
(25) :
254,256.
引用
认领
✕
来源:
NETL
NSTL
万方数据
基于代理服务器的动态Web页面采集框架的设计
杜海涛
1
扫码查看
点击上方二维码区域,可以放大扫码查看
作者信息
1.
214063 无锡商业职业技术学院 江苏 无锡
折叠
摘要
随着信息技术的快速发展,越来越多的网站采用AJAX技术,常见的爬虫框架不能有效的抓取动态网页上的数据本文,本文提出一种基于代理服务器的动态Web页面采集框架,框架通过设置代理服务器,向动态网站中注入JS代码,在内置浏览器中执行JS脚本,实现各种预定义的操作,从而实现对动态网页的数据采集.
关键词
JavaScript
/
动态Web页面
/
采集框架
/
代理服务器
引用本文
复制引用
出版年
2019
数字化用户
数字化用户
ISSN:
引用
认领
参考文献量
2
段落导航
相关论文
摘要
关键词
引用本文
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果