首页|基于专家系统的Web日志数据处理方法研究

基于专家系统的Web日志数据处理方法研究

扫码查看
企业员工访问网站的记录在企业服务器中形成了大规模日志数据,从这些海量数据中发掘出有意义的信息是管理企业员工重要的环节,并成为大数据时代关注的重点.完成数据挖掘的核心工作之一就是对原始数据的预处理,它影响到数据分析结果的准确度.但由于web日志是Apache、Nginx和ⅡS等web服务器运行时产生的系统日志,web日志格式根据使用web服务器的不同而不同.所以,传统的日志数据清洗方式难以应对目前如此复杂的日志格式.由于专家系统其技术特点能应对复杂的日志格式,所以通过结合专家系统,推理出对应的web日志格式,从而自动进行日志数据清洗,可以使得当下复杂海量web日志数据预处理更加高效,智能.首先,介绍了专家系统;其次,介绍了web日志数据一般的数据预处理流程;最后,结合专家系统对海量复杂的web日志数据进行数据预处理,并通过实验验证了该方法的可行性.
Research on Web Log Data Processing Method Based on Expert System

李春生、豆立宪、张可佳、刘涛、邹林浩

展开 >

东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318

专家系统 web日志数据 数据预处理 复杂日志格式 规则库

国家自然科学基金黑龙江省自然科学基金黑龙江省青年创新人才培养计划黑龙江省教育厅科研项目

51774090F2015020UNPYSCT-20201442017-YDL-12

2022

计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
年,卷(期):2022.32(7)
  • 4
  • 7