基于改进Mask R-CNN的在架图书书脊图像实例分割方法

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据
维普

中文摘要：运用人工智能技术将是构建下一代智慧图书馆的关键,为了实现图书的定位和识别,提出一种基于改进Mask R-CNN的在架图书书脊图像实例分割方法.考虑到图书密集排列、具有一定的旋转性、副本纹理极相似等难点,改进锚框为旋转矩形框,提出旋转区域建议网络取代区域建议网络;提出旋转特征提取方法可减少池化误差且有效提取目标特征,结合掩膜的旋转对齐以提升预测掩膜的准确性.建立了一个包含1849张在架图书书脊图像的标注数据集,提出方法的测试结果大幅度优于其他重要的实例分割算法,证实了在网络中使用旋转特征对于具有一定朝向的、密集的目标分割难题很有效.

外文标题：Improved Mask R-CNN based instance segmentation method for spine image of books on shelves

作者：

曾文雯、杨阳、钟小品

展开 >

作者单位：

深圳大学图书馆,广东深圳518060

深圳大学机电与控制工程学院,广东深圳518060

关键词：

智慧图书馆图像分割 Mask R-CNN 旋转特征提取

基金：

深圳市科技计划项目深圳大学—台北科技大学学术合作专题研究项目

项目编号：

JCYJ201803051239222932019009

出版年：

2021

DOI：

10.19734/j.issn.1001-3695.2021.01.0069

计算机应用研究

四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心

影响因子：0.93

ISSN：1001-3695

年,卷(期)：2021.38(11)

被引量4
参考文献量2