国家学术搜索
登录
注册
中文
EN
数字化用户
2019,
Vol.
25
Issue
(52) :
107-108.
基于Scrapy与Redis的分布式房源数据抓取系统
孙士兵
数字化用户
2019,
Vol.
25
Issue
(52) :
107-108.
引用
认领
✕
来源:
NETL
NSTL
万方数据
基于Scrapy与Redis的分布式房源数据抓取系统
孙士兵
1
扫码查看
点击上方二维码区域,可以放大扫码查看
作者信息
1.
410004 湖南长沙民政职业技术学院软件学院 湖南 长沙
折叠
摘要
系统突破单进程单机爬虫的瓶颈,设计了基于Redis分布式多爬虫共享队列的主题爬虫.采用Python开发的Scrapy框架来开发,Pycharm作为开发工具,使用Xpath技术对下载的网页进行数据的提取解析,运用Redis非关系型数据库做分布式,利用MongoDB非关系型数据库做数据存储,Scrapy-Redis组件作为辅助设计,并完成了能爬取网站上所有城市新房二手房数据的分布式爬虫系统.
关键词
Python
/
Scrapy
/
Redis
/
MongoDB
/
分布式爬虫
引用本文
复制引用
出版年
2019
数字化用户
数字化用户
ISSN:
引用
认领
参考文献量
2
段落导航
相关论文
摘要
关键词
引用本文
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果