计算机技术与发展2022,Vol.32Issue(2) :214-220.DOI:10.3969/j.issn.1673-629X.2022.02.035

基于改进Attention Mask编解码器CPI的研究

Research on Compound-protein Interaction Classification Based on Improved Attention Mask Encoder-decoder

李大舟 陈思思 高巍 于锦涛
计算机技术与发展2022,Vol.32Issue(2) :214-220.DOI:10.3969/j.issn.1673-629X.2022.02.035

基于改进Attention Mask编解码器CPI的研究

Research on Compound-protein Interaction Classification Based on Improved Attention Mask Encoder-decoder

李大舟 1陈思思 1高巍 1于锦涛1
扫码查看

作者信息

  • 1. 沈阳化工大学 计算机科学与技术学院,辽宁 沈阳 110142
  • 折叠

摘要

化合物-蛋白质相互作用(CPI)的研究对药物发现有着重要作用,它可以为药物靶标选择提供有价值的信息,在一定程度上提高先导化合物的命中率,进而加快药物发现的进程.由此提出了一种基于改进Attention Mask编解码器的化合物与蛋白质相互作用分类的预测模型,分别使用RDkit和Item2vec处理化合物的SMILES字符串和蛋白质的氨基酸序列,将得到的化合物和蛋白质低维特征表示的向量输入到该模型,通过分配权重的方式来计算蛋白质中的哪个子序列对化合物分子更重要,使用带有Attention机制的神经网络计算权重,模拟化合物和蛋白质之间的相互作用关系,最后作为一个二分类问题输出化合物和蛋白质是否相互作用的预测概率.模型性能测评采用ROC曲线下面积、准确召回率曲线作为评价指标,实验结果表明,该模型相比于GraphDTA和GCN模型而言,拥有更好的性能表现,AUC值提高了0.04左右,PRC值提高了0.07左右.

关键词

深度学习/多头自注意力/化合物蛋白相互作用/Item2vec/编码器-解码器

引用本文复制引用

基金项目

辽宁省教育科学技术研究项目(LJ2020033)

出版年

2022
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量2
段落导航相关论文