首页|基于深度自编码网络的全新药物分子生成模型及其应用以及新冠病毒关键蛋白酶的小分子抑制剂筛选

基于深度自编码网络的全新药物分子生成模型及其应用以及新冠病毒关键蛋白酶的小分子抑制剂筛选

汪益妃

基于深度自编码网络的全新药物分子生成模型及其应用以及新冠病毒关键蛋白酶的小分子抑制剂筛选

汪益妃1
扫码查看

作者信息

  • 1. 四川大学
  • 折叠

摘要

本人在攻读硕士学位期间,主要开展了两个课题的研究,即(1)基于深度自编码网络的全新药物分子生成模型及其应用,以及(2)针对新冠病毒关键蛋白酶的小分子抑制剂的筛选及其活性研究。具体内容简介如下: 第一部分 基于深度自编码网络的全新药物分子生成模型及其应用 近10年来,以深度学习(deep learning,DL)为代表的人工智能(artificial intelligence,AI)理论和方法研究获得了重大进展,并已被成功应用于图形图像、自然语言处理、语音识别、自动驾驶等领域,但其在药物研发中的应用尚处于起步阶段,如何将深度学习高效地应用于药物发现,提高药物研发效率,是当前创新药物研究领域的热点。本部分研究将基于近年来发展较快的深度自编码网络(deep autoencoder network,DAEN)算法理论,建立适合于全新药物分子设计的深度自编码网络架构,并利用该架构,针对RIPK1、KDM3B、KRASG12C等与肿瘤、炎症相关靶标,开展全新药物分子设计应用研究。 (一)新型深度自编码网络架构的建立 本节研究中首先构建了一个新的深度自编码网络(DAEN)架构,该架构的主体由编码网络(encoding network)、解码网络(decoding network)和预测模型(predicting model)三部分组成。其中,编码网络基于多层双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)堆叠的深度递归神经网络(recurrent neural network,RNN)架构,实现分子特征提取;解码网络基于多层长短时记忆网络(long short-term memory,LSTM)的RNN架构,实现参数拟合-推断双重功能;而预测网络基于支持向量机(support vector machine,SVM)等经典计算模型,实现靶标活性或物理化学性质预测。 (二)基于DAEN的全新RIPK1蛋白激酶抑制剂的发现 RIPK1是细胞程序性坏死的关键调控蛋白,其抑制剂被认为是程序性坏死相关疾病的潜在治疗药物。目前虽有多个RIPK1抑制剂报道,但仍然缺乏高活性和选择性的RIPK1抑制剂。在本节研究中,构建了基于DAEN的RIPK1蛋白激酶抑制剂生成模型。首先,使用预训练数据集(3.2亿个分子)和RIPK1活性化合物数据集(1,323个分子),经迁移学习训练DAEN-RIPK1抑制剂生成模型至收敛。经去重、去除训练集分子和物理化学性质筛选后,得到3,702个全新分子。进一步评价生成分子的骨架新颖性,筛选获得了3,143个具有全新骨架的分子。接着,使用分子对接评价这些化合物的靶标亲和力,根据对接打分和相互作用模式,挑选了一个具有全新骨架的化合物(RI-237)进行化学合成和生物活性验证。活性测试结果表明,RI-237的酶水平抑制活性(IC50)为463nM,在TNFα/Smac mimetic/Z-VAD-FMK(TSZ)诱导的HT29细胞程序性坏死模型中,对细胞的保护活性(EC50)为0.064±0.010μM。总之,利用深度自编码网络模型,设计发现了一个全新结构的先导化合物RI-237,针对该化合物的进一步结构优化尚在进行中。 (三)基于DAEN的赖氨酸去甲基化酶3B(KDM3B)抑制剂发现 KDM3B是赖氨酸去甲基化酶(KDM)家族的重要成员,在个体发育过程中起重要作用。研究表明,KDM3B的错误调控与多种恶性肿瘤的发生发展密切相关。因此,KDM3B被认为是相关肿瘤的潜在治疗靶标。但到目前为止,针对该靶点的小分子抑制剂报道还非常少。在本节研究中,根据已报道的KDM3B抑制剂以及同家族赖氨酸去甲基化酶的小分子抑制剂,构建了基于DAEN的新型KDM3B抑制剂的生成模型(DAEN-KDM3B)。首先,使用预训练数据集(3.2亿个分子)和KDM3B/KDM家族活性化合物数据集(269个分子),经迁移学习训练DAEN-KDM3B抑制剂生成模型至收敛。经去重、去除训练集分子和物理化学性质筛选后,得到3,076个全新分子。进一步,分析生成分子的金属配位能力(KDM3B的酶催化活性中心有Fe2+),并筛选得到2,550个具有金属配位潜力的全新结构分子。然后,使用分子对接模拟评价这些化合物的靶标亲和力。综合对接评分和相互作用模式,挑选了4个命中化合物。进一步,基于相似性搜索方法,购买了8个ChemDiv商业库分子,并测定其体外去甲基酶抑制活性。其中3个化合物具有微摩尔级KDM3B酶抑制活性。通过测试与甲基化相关的其他酶的活性,发现所得化合物具有一定的选择性。 (四)基于DAEN的KRASG12C共价抑制剂的发现 KRAS是最著名的癌基因之一,其异常表达或突变与肺癌、胰腺癌、结直肠癌等多种肿瘤的发生发展密切相关,其中G12C突变是KRAS最常见的一种突变。目前虽有多个靶向KRASG12C突变的小分子共价抑制剂报道,但尚无获批的上市药物。在本节研究中,采用“稳定非活性KRAS-GDP复合物”策略,构建了基于DAEN的KRASG12C共价抑制剂生成模型。首先,使用预训练数据集(1.17亿个分子)和KRASG12C化合物数据集(共992个分子),经迁移学习训练DAEN-KRASG12C抑制剂生成模型至收敛。训练活性预测模型,其预测准确率可达87.1%。对生成分子中预测具有活性的分子进行去重、去除训练集分子和物理化学性质等筛选,最后形成了一个包含5,622个全新分子的KRASG12C抑制剂集中组合筛选库。接着,使用分子对接评价这些化合物的靶标亲和力。最终,根据对接打分和相互作用模式,挑选出4个全新结构分子,已提供给合成团队进行化学合成。 第二部分针对新冠病毒关键蛋白酶的小分子抑制剂的筛选及其活性研究 由新型冠状病毒(SARS-CoV-2)引起的冠状病毒疾病-19(COVID-19)大流行对全球公共卫生造成了严重威胁。虽然预防性疫苗研发已取得了重大进展,然而针对新冠病毒的特异性抗病毒药物研发进展缓慢。在本部分研究中,针对调控新冠RNA复制和转录的关键蛋白酶,即主蛋白酶(main protease,Mpro)和木瓜样蛋白酶(papain-like protease,PLpro),开展了小分子抑制剂的筛选研究。 (一)在本节研究中,针对新冠Mpro蛋白(结构取自PDB6LU7),使用分子对接程序GOLD,从上市化合物库和临床试验化合物库等老药分子库(共14,021个化合物)中,筛选潜在活性化合物,使用GoldScore打分函数进行排序,从打分值较高的分子中挑选100个命中化合物。然后,使用原核细胞表达系统表达纯化了新冠Mpro蛋白,建立了基于荧光共振能量转移(FRET)的Mpro小分子抑制剂筛选系统。利用该系统,对虚拟筛选得到的100个命中化合物进行了活性测试,其中5个化合物显示了较好的活性,包括:MG-132、Narlaprevir、Boceprevir、Telaprevir和Simeprevir。最后,解析了Boceprevir和Telaprevir与Mpro的晶体结构。并基于此结构,本人所在课题组进行了结构优化和抗病毒活性测试,获得了两个高活性并具有良好体内外抗新冠病毒活性的化合物(MI-09和MI-30),相关研究发表于Science(2021)(本人为共同第一作者)。 (二)针对PLpro的全新骨架结构苗头化合物的虚拟筛选和活性验证 在本节研究中,利用分子对接程序CDOCKER,筛选了商业化合物库(共约168万个化合物)和自有化合物库(3,860个化合物)。首先使用Discovery Studio3.1平台对虚拟化合物库进行类药性过滤(基于Lipinski五规则),以及对受体蛋白PLpro(取自PDB7JRN)进行预处理,包括去除水分子、杂原子、指定分子力场等,并定义活性位点。然后利用CDOCKER模块进行分子对接,使用CDOCKER Scores打分函数进行排序。对打分排序较高的100个分子,进一步分析其骨架的新颖性以及与受体的相互作用,最后从中挑选了20个命中化合物。接下来,使用原核细胞表达系统表达纯化了新冠PLpro蛋白,建立了基于FRET的PLpro小分子抑制剂筛选系统。并利用该系统测试了虚拟筛选中获得的20个命中化合物的生物活性。其中,化合物Y949和C528显示了一定的PLpro酶抑制活性,其IC50分别为97.7μM和145.0μM。还利用分子对接预测了Y949与PLpro的相互作用模式。该研究为后续靶向SARS-CoV-2PLpro的小分子抑制剂研发提供了具有新型骨架结构的苗头化合物。 综上所述,本人在攻读硕士期间,建立了一种新型深度自编码网络架构,并基于该架构,针对三种与肿瘤、炎症等疾病相关的靶标RIPK1、KDM3B和KRASG12C,建立了全新药物分子生成模型,并利用这些生成模型成功地开展了全新结构分子的设计。另外,由于2020年初突如其来的新冠疫情,本人也参加了针对新冠病毒关键蛋白酶的小分子抑制剂的筛选以及活性研究(应急攻关课题),获得了多个靶向Mpro老药分子和具有全新骨架结构的PLpro小分子抑制剂。总之,本研究为针对RIPK1、KDM3B和KRASG12C的肿瘤、炎症的创新药物研发以及针对Mpro和PLpro的抗新冠病毒药物研发奠定了良好基础。

关键词

新冠病毒关键蛋白酶/小分子抑制剂筛选/药物分子生成模型/深度自编码网络

引用本文复制引用

授予学位

硕士

学科专业

药剂学

导师

李琳丽

学位年度

2021

学位授予单位

四川大学

语种

中文

中图分类号

R9
段落导航相关论文