为了解决疾病预测系统在机器学习过程中数据导入效率不高、易出错、难以审计的缺点,提出一种通过API导入数据的方法.该方法基于SOAP和RESTful API技术,可实现跨编程语言的数据远程调用,最终实现数据集从数据库自动导入到机器学习服务器.实验结果表明,用10万条16字段的数据集测试,相对于基于文件导入方式,后者导入医疗数据的速度是前者的53倍以上,在1000次数据集测试导入过程中实现了医疗数据的零出错和操作的可审计性.基于API导入数据的方法可有效地提高医疗数据导入效率和稳定性,缩短机器学习模型训练周期,具有可审计性,进一步保障了医疗数据的安全性.