摘要
人脸聚类技术是大规模人脸图像标注和管理的关键性技术。人脸图像易受到光照、角度等因素的影响,因此传统的聚类算法达不到预期效果。近年来,以图卷积网络为主体的人脸聚类模型凭借强大的结构信息挖掘能力取得了优异的表现,成为研究的热点。因为人脸数据集不具备天然的图结构,而目前的建图方法缺乏有效的概念指导,一般是将每个图像根据相似性与固定数量的邻居相连,所以图结构中存在众多低质量边,降低了聚类效果。此外,现有的聚类有效性指标要么依赖数据的标签信息,要么无法准确评估聚类的实际效果,不能适用于大规模的无标注数据。鉴于以上的不足和挑战,本文提出了基于图卷积网络的人脸聚类算法和新的指标。论文的主要工作包括: (1)结合节点间标签关系和相似性提出了置信边的概念,并指出增大图中置信边的比例对聚类性能的提升至关重要。基于置信边提出了新的建图方式包括局部信息融合和无监督邻居确定分别度量节点的连接关系和删除众多低质量边,得到高质量图数据。 (2)为提升聚类性能,将人脸聚类转变成图表征学习任务,并提出了基于置信边的图卷积网络生成更适合聚类的节点特征。增强后的特征可以作为输入使传统的聚类算法得到更好的结果。 (3)将结构熵引入人脸聚类,以一维结构熵最小化选择最优的超参数,并根据现有指标存在的不足,将结构熵领域中应用广泛的归一化残差熵作为新的聚类有效性指标,阐明了其优势与不足。 在人脸数据集MS-Celeb-1M、行人重识别数据集MSMT17和服饰数据集DeepFashion上,本文提出的方法与一系列人脸聚类算法进行了对比,实验结果表明本文算法在所有数据集上均取得了目前最好的表现,且提升显著,验证了算法的有效性。在MS-Celeb-1M上设计的消融实验进一步体现了模型的鲁棒性,以及置信边概念的合理性。