首页|基于神经网络的蛋白质二级结构分类研究与应用

基于神经网络的蛋白质二级结构分类研究与应用

石立

基于神经网络的蛋白质二级结构分类研究与应用

石立1
扫码查看

作者信息

  • 1. 北方民族大学
  • 折叠

摘要

随着基因组学的发展,蛋白质种类日益增多,蛋白质结构分类重要性日益增长,而历代传统蛋白质结构预测方法具有精度不高的问题。同时,神经网络是近年来的热点研究领域,是人工智能研究的重要组成部分,其应用领域包括:分类、预测、模式识别、信号处理和图像处理等,并继续向其他领域延伸。神经网络的优化与改进从一开始就是理论和应用的重要研究内容之一,特别是前馈神经网络的研究,目前尚没有一个理想的优化方案。面对这一问题,本文针对性地对灰狼优化算法(Grey Wolf Optimizer, GWO)进行改进,并应用到神经网络中。针对传统算法在蛋白质结构分类精度低的问题,本文提出基于灰狼优化算法的图像分类方法,分别由灰狼优化算法优化的卷积神经网络(Convolutional Neural Networks, CNN)和卷积循环神经网络(Convolutional Recurrent Neural Networks, CRNN)对蛋白质二级结构进行分类。 本文主要完成了以下工作: (1)从蛋白质数据库PDB和SCOP中获得蛋白质二级结构3D模型,转化为4类十四位点拍摄的2D图像,总计获得576772张50*50像素的图片数据,考虑到所选取的网络模型层数较深和数据集过大导致的训练时间过长,随机选取300单位ID的蛋白质2D图像做成数据集,整个数据集共包含16800张2D图片。 (2)基础灰狼优化算法的改进:针对GWO后期收敛速度慢和易陷入局部最优这两个缺陷,提出了调整收敛因子a的收敛方式和改进搜索机制的方法:GWO收敛过程不完全是线性收敛,而原始的GWO中的参数a是线性收敛的,可以通过改进参数a,将参数a由线性收敛变为非线性收敛,从而实现控制全局搜索与局部搜索;通过改进搜索机制,给予GWO加权距离,利用最佳位置的加权总和进行位置更新,使GWO前期更快收敛,从而影响后期收敛速度。 (3)利用改进后的灰狼优化算法,针对不同模型如CNN和CRNN分别进行相应的优化。在CNN中,使用IGWO对L2正则化系数和学习率进行调整;在CRNN中,使用IGWO对多种优化器进行优化,并分别进行实验。通过调整IGWO的迭代次数、灰狼数量、搜索边界和空间维数,计算所需优化参数的个体适应度函数,对神经网络模型的各种参数进行优化,并应用于蛋白质二级结构分类。 基于以上工作,设计并实现相关算法,在蛋白质二级结构分类任务中,IGWO-CNN达到了92.6%的准确率,IGWO-CRNN达到了89.6%的准确率,并且与多种传统方法进行对比实验,实验证明:本文方法与现有方法相比在,评价指标上有明显提升,根据神经网络在图像领域上的表现,我们将其运用在蛋白质结构类和折叠类的分类识别上可行且有较好效果,证明了本文方法的可行性、有效性和鲁棒性。

关键词

卷积神经网络/卷积循环神经网络/灰狼优化算法/图像分类/蛋白质二级结构分类

引用本文复制引用

授予学位

硕士

学科专业

计算机系统结构

导师

马金林

学位年度

2020

学位授予单位

北方民族大学

语种

中文

中图分类号

TP
段落导航相关论文