首页|基于ProtBert预训练模型的HLA-Ⅰ和多肽的结合预测算法

基于ProtBert预训练模型的HLA-Ⅰ和多肽的结合预测算法

扫码查看
针对现有的第Ⅰ类H LA(H LA-Ⅰ)分子与多肽结合亲和力预测算法在特征构造时依赖传统序列评分函数的问题,为突破用经典机器学习算法构造氨基酸序列特征的局限性,提出一种基于蛋白质预训练模型ProtBert的HLA-Ⅰ与多肽的结合预测算法ProHLAⅠ.该算法利用生命体语言与文本语言在组成上的共性,将氨基酸序列类比句子,通过整合ProtBert预训练模型、BiLSTM编码和注意力机制的网络结构优势,对HLA-Ⅰ序列和多肽序列进行特征提取,从而实现H LA-Ⅰ独立于位点的多肽结合预测.实验结果表明,该模型在两组独立测试集中均取得了最优性能.
Binding Prediction Algorithm of HLA-Ⅰ and Polypeptides Based on Pre-trained Model ProtBert

周丰丰、张亚琪

展开 >

吉林大学 计算机科学与技术学院,长春 130012

吉林大学 符号计算与知识工程教育部重点实验室,长春 130012

HLA-Ⅰ结合肽预测 自然语言处理 注意力机制 BERT模型 双向长短期记忆模型(BiLSTM)

国家自然科学基金国家自然科学基金吉林省中青年科技创新创业卓越人才(团队)项目(创新类)吉林省大数据智能计算实验室项目

62072212U19A206120210509055RQ20180622002JC

2023

吉林大学学报(理学版)
吉林大学

吉林大学学报(理学版)

CSTPCD北大核心
影响因子:0.46
ISSN:1671-5489
年,卷(期):2023.61(3)
  • 4