摘要
近年来,人工智能(Artificial Intelligent,AI)领域持续快速升温,机器学习等人工智能技术得到快速地发展,并被广泛应用于各个领域,如在图像处理领域和语音识别领域大放异彩。随着人口的增长和城市化的快速发展,大型岩土工程建设如火如荼。在对岩土工程现场进行岩土工程勘察工作的同时积累了大量的勘察和试验数据。其中,不排水抗剪强度是黏性土的强度特征分析和稳定性评价的重要指标,对公路桥梁等基础设计具有重要影响。传统的做法采用特定地方的数据且仅考虑非常有限的变量,利用经验关联关系建立起经验公式。本文基于国际土力学与岩土工程学会(ISSMGE)工程实践风险评估与管理专委会(TC304)数据库中的CLAY/6/535黏土数据集,创新性地应用先进的极限梯度提升XGBoost(eXtreme Gradient Boosting)和轻型梯度提升器LightGBM(Light Gradient Boosting Machine)集成学习算法来构建黏性土的不排水抗剪强度模型并进行分析研究。研究重点集中在数据集的统计分析与预处理,集成学习算法的研究与实现和模型融合等方面。本研究是以大数据和人工智能为中心的“新型基础设施建设”在传统岩土工程和岩土力学领域的应用尝试,得到主要结论如下: 从数据统计描述和预处理方面,通过采用箱线图方法和孤立森林算法结合剔除了6组异常数据组和特征变量中的存在的异常值。与此同时,又对剔除特征变量中异常值后留下的空值用MissForest算法进行填补。通过对比数据预处理前后的建模结果,发现去除异常值后明显有助于提高模型的准确性和稳定性。此外,还发现缺失值填补前后对所建立的XGBoost和LightGBM模型几乎没有影响,说明在存在少量缺失值的情况下建立的两种模型仍可以保证准确性和稳定性。 对于算法的超参数调优,本文提出了贝叶斯优化的方法对这两种集成算法的超参数进行调参。通过对两种集成算法超参数的了解与介绍,每种算法确定了7个超参数和对应的范围进行贝叶斯优化算法的超参数调优,在500次迭代下最终确定了两种模型的最优的超参数组合。通过对比调参前后的两种模型的建模结果分析,发现经过调参建立的模型在各评价指标上预测性能和模型稳定性都有很大的提升。 在5折交叉验证(Five-fold cross validation)下建立起5个的XGBoost和LightGBM模型展示其预测性能和稳定性,在与对比算法和经验公式进行对比,发现所提出两种集成学习模型具有明显的优势。将XGBoost和LightGBM模型经过平均融合形成Averaging模型,发现融合后的模型很好的集成了这两种集成模型的预测性能优势。最后给出了特征的相对重要性排序,增加模型的可解释性,对探索不排水抗剪强度特性具有重要的指导意义。