摘要
随着互联网和移动设备的迅速发展,图像数据迎来了巨量的增长。图像分类作为自动化图像处理中的重要一环也处于越来越重要的位置。近年来,在图像分类领域中卷积神经网络取得了巨大的成功,在某些任务中甚至取得了超越人类的表现。但卷积神经网络也存在着可解释性差以及对位置关系在内的结构信息利用不足等问题。胶囊网络尝试通过“胶囊”以及“动态路由”来解决这些问题,并取得了很好的初始效果。但是胶囊网络在较复杂的数据集上表现欠佳。 本课题通过增加胶囊网络深度的方法提升胶囊网络在较复杂数据集上的性能。为了增加胶囊网络深度,设计了卷积胶囊层。该层通过为卷积操作设计动态路由算法,一方面增加了网络的卷积深度,另一方面扩展了动态路由链的长度。此外,本课题还提出了胶囊池化层,实现了在不破坏特征的位置信息的情况下减少参数规模。本课题提出了深度胶囊网络,在Cifar-10数据集上取得了明显提升。并在其他数据集上进行了验证。胶囊池化层能在减少50%层间参数的情况下维持网络的性能。此外,还对深度胶囊网络在重叠字母识别和手写数字评分这两个应用场景上进行了测试。