首页|基于改进Mask R-CNN的在架图书书脊图像实例分割方法

基于改进Mask R-CNN的在架图书书脊图像实例分割方法

扫码查看
运用人工智能技术将是构建下一代智慧图书馆的关键,为了实现图书的定位和识别,提出一种基于改进Mask R-CNN的在架图书书脊图像实例分割方法.考虑到图书密集排列、具有一定的旋转性、副本纹理极相似等难点,改进锚框为旋转矩形框,提出旋转区域建议网络取代区域建议网络;提出旋转特征提取方法可减少池化误差且有效提取目标特征,结合掩膜的旋转对齐以提升预测掩膜的准确性.建立了一个包含1849张在架图书书脊图像的标注数据集,提出方法的测试结果大幅度优于其他重要的实例分割算法,证实了在网络中使用旋转特征对于具有一定朝向的、密集的目标分割难题很有效.
Improved Mask R-CNN based instance segmentation method for spine image of books on shelves

曾文雯、杨阳、钟小品

展开 >

深圳大学图书馆,广东深圳518060

深圳大学机电与控制工程学院,广东深圳518060

智慧图书馆 图像分割 Mask R-CNN 旋转特征提取

深圳市科技计划项目深圳大学—台北科技大学学术合作专题研究项目

JCYJ201803051239222932019009

2021

计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
年,卷(期):2021.38(11)
  • 4
  • 2