地球信息科学学报2024,Vol.26Issue(3) :620-637.DOI:10.12082/dqxxkx.2024.230427

耦合统计方法、机器学习模型和聚类算法的滑坡易发性评价方法

Landslide Susceptibility Mapping Methods Coupling with Statistical Methods, Machine Learning Models and Clustering Algorithms

王启盛 熊俊楠 程维明 崔兴洁 庞全 刘俊 陈文杰 唐浩然 宋南霄
地球信息科学学报2024,Vol.26Issue(3) :620-637.DOI:10.12082/dqxxkx.2024.230427

耦合统计方法、机器学习模型和聚类算法的滑坡易发性评价方法

Landslide Susceptibility Mapping Methods Coupling with Statistical Methods, Machine Learning Models and Clustering Algorithms

王启盛 1熊俊楠 2程维明 3崔兴洁 1庞全 4刘俊 5陈文杰 1唐浩然 1宋南霄1
扫码查看

作者信息

  • 1. 西南石油大学土木工程与测绘学院,成都610500
  • 2. 西南石油大学土木工程与测绘学院,成都610500;中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京100101
  • 3. 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京100101
  • 4. 四川省安全科学技术研究院,成都610046;四川安信科创有限公司,成都610041
  • 5. 中山大学地理科学与规划学院,广州510275
  • 折叠

摘要

我国西部山区滑坡灾害频发,精确评估滑坡易发性对地质灾害防治至关重要.结合统计方法与机器学习模型的集成模型已广泛的应用于滑坡易发性评价,然而对其结果的进一步优化仍值得考虑.本文提出一种耦合统计方法、机器学习模型以及聚类算法的综合评价方法,以宁南县为例,研究其对滑坡易发性评价精度的提升效应.该方法首先将信息量法(Informa-tion Value,IV)、确定系数法(Certainty Factor,CF)和频率比法(Frequency Ratio,FR)分别与随机森林模型(Random Forest,RF)结合,得到三种集成模型(IV-RF、CF-RF、FR-RF).此后,引入ISO聚类算法对三种集成模型的结果进行分级,得到三种耦合模型(IV-RF-ISO、CF-RF-ISO、FR-RF-ISO).AUC值(Area Under the Curve)、准确率、F1分数和种子单元面积指数(Seed Cell Area Indexes,SCAI)被用于评估模型的精度.结果显示,集成模型性能均优于单一模型,其准确率和F1分数均大于0.85,AUC值均大于0.9.其中FR-RF模型表现最优,准确率(0.911)、F1分数(0.912)和AUC值(0.965)较FR模型分别提升了0.095、0.096和0.074.与自然断点法和Kmeans聚类法相比,引入ISO算法的耦合模型FR-RF-ISO分级效果最优,其高低易发区SCAI值的差异更为显著.本研究成果表明,耦合统计方法、机器学习与聚类算法的综合评价方法具有较高精度,为提高滑坡易发性评价精度提供思路.

关键词

滑坡易发性/信息量/确定系数/频率比/随机森林/聚类算法/宁南县

Key words

landslide susceptibility/information value/certainty factor/frequency ratio/random forest/clustering algorithm/Ningnan County

引用本文复制引用

基金项目

四川省科技厅重点研发项目(2021YFQ0042)

西藏自治区科技计划(XZ201901-GA-07)

国家重点研发计划(2020YFD1100701)

中国科学院战略先导专项(A类)(XDA20030302)

四川省科研院所基本科研业务费项目(2023JDKY0039-01)

出版年

2024
地球信息科学学报
中国科学院地理科学与资源研究所

地球信息科学学报

CSTPCDCSCD北大核心
影响因子:1.004
ISSN:1560-8999
被引量2
参考文献量54
段落导航相关论文