摘要
自闭症(Autism spectrum disorder,ASD)是一种复杂的神经发育障碍疾病,至今仍没有客观且统一的诊断方法。ASD多中心磁共振影像数据集的发布以及机器学习技术的发展,极大地促进了ASD的客观诊断。然而由于因采集标准不统一导致的多中心数据间的异质性,以及疾病自身因年龄、智商等引起的异质性,目前ASD的客观诊断并没有取得令人满意的结果。 基于ASD的多中心多模态数据,本文先从减小ASD多中心数据间的异质性的影响出发,将每个中心的预测视为一个学习任务,提出了两种多任务学习方法。然后为进一步减小疾病自身异质性的影响,本文又提出了一种结合多源域适应和多任务学习的方法,将每个年龄智商组的预测作为一个学习任务。具体工作如下: (1)本文提出了一种引入特征之间关系的多任务学习方法来诊断ASD和预测其严重性。已有的ASD多任务学习方法仅考虑了任务之间的关系和模态之间的关系,而没有考虑数据内部的约束。为此,本文考虑了特征之间的相似性约束以利用数据深层次信息来提高预测性能。提出的方法在性能上超过了其它方法,ASD诊断的平均准确率为70.99%,ASD严重性预测的平均相关值为0.55。 (2)针对已有的方法仅考虑了多个中心的共享特征而忽视了各中心特有的特征,本文提出了一种基于共享特征和中心特定特征的多任务学习方法来获得更准确的判别系数以提高ASD的诊断性能。将判别系数矩阵分解为共享特征矩阵和中心特定矩阵,并对共享特征矩阵施加行稀疏约束学习多中心共享特征,对中心特定矩阵施加元素稀疏约束来学习中心特定特征。此外,进一步将低秩约束施加到多模态数据的共享特征矩阵上,以捕获多个相关任务之间的关系。提出的方法获得了71.84%的平均诊断准确率,明显优于其它方法。 (3)为联合减小ASD多中心数据间的异质性和ASD自身的异质性所带来的影响,本文提出了一种多源域适应与多任务学习相结合的ASD预测方法。首先将一种单源域适应方法改进为多源域适应方法,将多中心数据投影变换到相同的空间来减小多中心数据间的分布差异。然后将被试根据年龄和言语智商进行分组,采用前边提出的多任务学习方法学习组共享特征和组特定特征进行分组诊断。基于四个中心的全部年龄段的数据,提出的方法获得了75.13%的平均诊断准确率,较其它对比方法均有所提升。 提出的三种方法均提高了ASD的预测性能,有助于更好地辅助医生进行临床诊断,从而促进ASD病理机制的理解。