首页|基于页面内容分析的钓鱼网站检测系统的设计与实现

基于页面内容分析的钓鱼网站检测系统的设计与实现

王文帮

基于页面内容分析的钓鱼网站检测系统的设计与实现

王文帮1
扫码查看

作者信息

  • 1. 哈尔滨工业大学
  • 折叠

摘要

随着网络层在人民生活中的快速发展,国家在网络安全监管方面上的需求变得越来越迫切。钓鱼网站检测系统是北京赛思信安技术股份有限公司的重点网络安全技术发展建设的项目之一。其中基于页面内容分析的钓鱼网站检测系统作为整体系统中的重要部分,其设计目标是要建立一个能够有效地检测出针对合法网站进行仿冒的钓鱼网站的处理系统。 论文以调研目前业界钓鱼网站的现状及发展成果为基础,介绍了国内和国外钓鱼网站检测的现状,并结合当前国家针对钓鱼网站的防御和检测情况,总结了目前国家对钓鱼网站的检测的要求和标准。通过全面且深入的分析来设计面向需求的钓鱼网站检测系统并加以实现。 论文以LINUX系统为开发平台,主要的开发语言采用C++并辅以java语言执行数据管理。系统组成部分包括URL去重模块、白名单匹配模块、多模匹配模块、哈希相似度判定模块、日志模块等模块。由模块间的协作实现新增 URL条目的检测业务、汇报任务、本地日志生成等任务,满足了系统对钓鱼网站检测的要求。本文通过连接池的技术解决异步域名解析和下载HTML页面内容的工作,采用多模匹配技术解决了特征文本的筛选的困难,使用哈希算法进行相似的的匹配和判断。 该钓鱼网站检测系统可以提供快速、稳定的钓鱼网站检测服务。能够根据导入的新增URL条目,实现相应的检测任务。通过对该系统的不同层次的测试,结果可以通过基于页面内容分析的钓鱼网站检测系统的业务需求。基本达到功能性需求,在性能方面初步达到标准。

关键词

钓鱼网站/检测系统/页面内容分析/多模匹配/哈希相似度

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

李东/葛瑞海

学位年度

2015

学位授予单位

哈尔滨工业大学

语种

中文

中图分类号

TP
段落导航相关论文