基于专家系统的Web日志数据处理方法研究

Research on Web Log Data Processing Method Based on Expert System

李春生 ¹豆立宪 ¹张可佳 ¹刘涛 ¹邹林浩¹

扫码查看

作者信息

1. 东北石油大学计算机与信息技术学院,黑龙江大庆 163318
折叠

摘要

企业员工访问网站的记录在企业服务器中形成了大规模日志数据,从这些海量数据中发掘出有意义的信息是管理企业员工重要的环节,并成为大数据时代关注的重点.完成数据挖掘的核心工作之一就是对原始数据的预处理,它影响到数据分析结果的准确度.但由于web日志是Apache、Nginx和ⅡS等web服务器运行时产生的系统日志,web日志格式根据使用web服务器的不同而不同.所以,传统的日志数据清洗方式难以应对目前如此复杂的日志格式.由于专家系统其技术特点能应对复杂的日志格式,所以通过结合专家系统,推理出对应的web日志格式,从而自动进行日志数据清洗,可以使得当下复杂海量web日志数据预处理更加高效,智能.首先,介绍了专家系统;其次,介绍了web日志数据一般的数据预处理流程;最后,结合专家系统对海量复杂的web日志数据进行数据预处理,并通过实验验证了该方法的可行性.

关键词

专家系统/web日志数据/数据预处理/复杂日志格式/规则库

引用本文复制引用

基金项目

国家自然科学基金(51774090)

黑龙江省自然科学基金(F2015020)

黑龙江省青年创新人才培养计划(UNPYSCT-2020144)

黑龙江省教育厅科研项目(2017-YDL-12)

出版年

2022

计算机技术与发展

陕西省计算机学会

计算机技术与发展

CSTPCD

影响因子：0.621

ISSN：1673-629X

被引量4

参考文献量7

段落导航