华西口腔医学杂志2023,Vol.41Issue(6) :686-693.DOI:10.7518/hxkq.2023.2023124

基于机器学习的四川省12岁儿童龋齿预测模型

Prediction model of dental caries in 12-year-old children in Sichuan Province based on machine learning

严鑫淼 孙桃兰 卢雨航 谭馨 王卓 李淼晶
华西口腔医学杂志2023,Vol.41Issue(6) :686-693.DOI:10.7518/hxkq.2023.2023124

基于机器学习的四川省12岁儿童龋齿预测模型

Prediction model of dental caries in 12-year-old children in Sichuan Province based on machine learning

严鑫淼 1孙桃兰 1卢雨航 1谭馨 1王卓 2李淼晶3
扫码查看

作者信息

  • 1. 成都医学院公共卫生学院,成都 610500
  • 2. 四川省疾病预防控制中心,成都 610500
  • 3. 成都医学院大健康与智能工程学院,成都 610500
  • 折叠

摘要

目的 采用机器学习算法构建儿童龋齿预测模型,寻找儿童龋齿的危险因素,有针对性地提出儿童口腔健康改善措施、政策建议.方法 采用分层整群随机抽样方法,根据四川省各地开展政策措施不同,在四川省8个市中随机抽取3~4所中学的12岁在校学生进行问卷调查、口腔检查和体格检查,采用多因素Logistic回归分析12岁儿童龋齿的危险因素.将数据集按7∶3随机分为训练集和验证集,使用R 4.1.1构建随机森林、决策树、极致梯度提升和Logistic回归4种机器学习算法,应用受试者工作特征(ROC)曲线下面积(AUC)评估4种预测模型的预测效果.结果 研究共纳入符合标准的12岁儿童4439例,其中恒牙患龋率为50.93%.多因素Logistic回归分析结果显示,身体质量指数、父亲最高学历、母亲最高学历、是否刷牙、每天刷几次牙、刷牙时使用牙膏、刷牙时长、饭后漱口、刷牙后睡前进食、甜饮料、零食、去牙科诊所看牙、几岁刷牙与儿童龋齿存在关联(P<0.05).随机森林、决策树、Logistic回归、极致梯度提升预测儿童龋齿的AUC值分别为0.840、0.755、0.799、0.794,在随机森林模型中,贡献度最高的变量为刷牙后睡前进食.结论 基于随机森林建立了一个儿童龋齿的预测模型,具有较好的预测效果.在此基础上有针对性地对影响儿童龋齿发生的主要影响因素采取预防措施有利于降低儿童龋齿的发生率.

关键词

儿童龋齿/机器学习/随机森林/影响因素/预测模型

Key words

children caries/machine learning/random forest/influencing factor/prediction model

引用本文复制引用

基金项目

四川省卫生健康委科研项目(20PJ122)

出版年

2023
华西口腔医学杂志
四川大学

华西口腔医学杂志

CSTPCDCSCD北大核心
影响因子:1.336
ISSN:1000-1182
被引量1
参考文献量6
段落导航相关论文