基于深度卷积神经网络的三维模型检索研究

李江川¹

扫码查看

作者信息

1. 浙江工业大学
折叠

摘要

随着三维模型在三维游戏、工业设计CAD库、虚拟现实等方面的广泛应用，涌现出了越来越多的三维模型库。相对于重新设计一个新的模型来说，通过检索的方式寻找已有模型进行复用可以大大降低工作量，因此三维模型检索问题逐渐成为了当前的研究热点。本文首先对三维模型检索和深度学习的相关技术要点进行了概述，包括特征提取、卷积神经网络结构以及常用的距离计算方法和检索评估指标；然后从视图的渲染、较优视图的选取以及深度特征的提取等方面介绍了检索流程。本文的主要工作如下： 1．提出一种使用自然图像作为输入源，以三维模型的较优视图集为基础，通过深度卷积神经网络的训练提取深度特征用于检索的三维模型检索方法。首先，从多个视点对三维模型进行视图提取，并按照灰度熵的排序选取较优视图；其次通过深度卷积神经网络对视图集进行训练，从而提取较优视图的深度特征并进行降维；同时，对输入的自然图像提取边缘轮廓图，经过相似度匹配获得一组三维模型；最后，基于检索结果中同类模型总数占检索列表长度的比例对列表进行重排序，获得最终的检索结果。 2．针对现有的三维模型检索方法使用的特征维度较高，检索时需要耗费大量时间的问题，提出一种结合深度哈希编码的分层次检索方法。首先根据视图灰度熵选取较优视图作为训练集，然后在卷积神经网络的全连接模块加上一层隐层，用于提取哈希编码；经过充分训练后，该网络结构可以同时提取到视图的哈希编码和深度特征；在检索时，首先计算输入图像和视图集中视图的哈希编码之间的汉明距离，将距离低于某阈值的视图放入视图池中，然后在视图池中基于深度特征进行二次检索。得益于二值哈希编码的汉明距离计算的低复杂度，可以快速排除无关视图，有效提高检索效率。 3．基于以上两部分工作，本文构建了以自然图像作为输入源，基于卷积神经网络提取特征的方法。相较以示例模型、手绘草图等作为输入源的三维模型检索方法，本文依托网络上海量的自然图像资源，进一步降低了输入源的获取难度，使三维模型的检索流程更为符合实际需求。

关键词

三维模型检索/视图选取/特征提取/深度学习/深度哈希

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

刘志

学位年度

2018

学位授予单位

浙江工业大学

语种

中文

中图分类号

段落导航