计算机研究与发展2023,Vol.60Issue(11) :2594-2610.DOI:10.7544/issn1000-1239.202220334

基于异常特征模式的心电数据标签清洗方法

A Label Cleaning Method of ECG Data Based on Abnormality-Feature Patterns

韩京宇 陈伟 赵静 郎杭 毛毅
计算机研究与发展2023,Vol.60Issue(11) :2594-2610.DOI:10.7544/issn1000-1239.202220334

基于异常特征模式的心电数据标签清洗方法

A Label Cleaning Method of ECG Data Based on Abnormality-Feature Patterns

韩京宇 1陈伟 1赵静 1郎杭 1毛毅1
扫码查看

作者信息

  • 1. 南京邮电大学计算机学院 南京 210023;江苏省大数据安全与智能处理重点实验室(南京邮电大学) 南京 210023
  • 折叠

摘要

心电图(electrocardiogram,ECG)异常的自动检测是一个典型的多标签分类问题,训练分类器需要大量有高质量标签的样本.但心电数据集异常标签经常缺失或错误,如何清洗弱标签得到干净的心电数据集是一个亟待解决的问题.在一个标签完整且准确的示例数据集辅助下,提出一种基于异常特征模式(abnormality-feature pattern,AFP)的方法对弱标签心电数据进行标签清洗,以获取所有正确的异常标签.清洗分 2个阶段,即基于聚类的规则构造和基于迭代的标签清洗.在第 1阶段,通过狄利克雷过程混合模型(Dirichlet process mixture model,DPMM)聚类,识别每个异常标签对应的不同特征模式,进而构建异常发现规则、排除规则和 1组二分类器.在第 2阶段,根据发现和排除规则辨识初始相关标签集,然后根据二分类器迭代扩展相关标签并排除不相关标签.AFP方法捕捉了示例数据集和弱标签数据集的共享特征模式,既应用了人的知识,又充分利用了正确标记的标签;同时,渐进地去除错误标签和填补缺失标签,保证了标签清洗的可靠性.真实和模拟数据集上的实验证明了AFP方法的有效性.

关键词

心电图/多标签分类/异常标签/异常特征模式/二分类器/标签清洗

Key words

electrocardiogram(ECG)/multi-label classification/abnormality labels/abnormality-feature pattern(AFP)/binary discriminator/label cleaning

引用本文复制引用

基金项目

国家自然科学基金(62002174)

出版年

2023
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
参考文献量6
段落导航相关论文