首页|重要Tor暗网站点的验证码快速识别和数据采集

重要Tor暗网站点的验证码快速识别和数据采集

QUICK IDENTIFICATION OF VERIFICATION CODES AND DATA COLLECTION ON KEY TOR DARK WEB SITES

扫码查看
针对面向Tor暗网的数据采集和信息监控的任务,为了解决爬取重要Web站点中所遇到的验证码自动识别这个技术难点,设计一套结合CNN网络、GRU网络和ctc loss的快速识别模型,并将其应用到Tor暗网站点的数据采集系统中去.一段时间的实际运行结果充分证明了该Tor暗网数据采集系统能够快速、准确地识别重要Tor暗网站点的验证码,自动绕过检验机制后爬取并存储站点的数据信息,从而有力支撑了暗网数据提炼、分析和挖掘的后续工作.

龙军、王轶骏、薛质

展开 >

上海交通大学电子信息与电气工程学院 上海200240

Tor暗网 CNN网络 GRU网络 ctc loss算法 Scrapy爬虫

国家重点研发计划"网络空间安全"重点专项

2016QY01W0202

2022

计算机应用与软件
上海市计算技术研究所 上海计算机软件技术开发中心

计算机应用与软件

CSTPCD北大核心
影响因子:0.615
ISSN:1000-386X
年,卷(期):2022.39(7)
  • 2
  • 4