首页|基于机器学习探究多肽自组装的构效关系及影响因素

基于机器学习探究多肽自组装的构效关系及影响因素

曹娜娜

基于机器学习探究多肽自组装的构效关系及影响因素

曹娜娜1
扫码查看

作者信息

  • 1. 中南林业科技大学
  • 折叠

摘要

多肽是由α-氨基酸通过脱水缩合形成肽键连接的生物高分子化合物,人体内诸多活性物质以肽的形式存在,因其结构相似而具优异生物相容性与高稳定性。多肽药物的特异性功能使其能更准确地靶向于目标分子,从而降低对非目标分子的负面影响,被广泛应用于癌症、糖尿病、免疫系统相关疾病的治疗。然而当下肽相关领域研究主要依赖实验结果与经验法则,效率低且易受环境及人为误差影响。近年来,随着计算机技术快速发展,计算机辅助研究成为实验研究重要补充且潜力巨大。 本研究以多肽自组装为核心对象,深入挖掘相关文献,利用机器学习技术实现了对文献库中关键信息的高效提取,并对提取的信息进行细致的清洗和整理。在此基础上,通过构建的一维多肽自组装语料库,探究了氨基酸组成(AAC)、原子组成(ATC)和物理化学性质(PCP)特性对多肽二级结构和自组装形貌的影响程度,并运用这一小型数据集构建了最优机器学习预测模型,从而深度探究多肽自组装的构效关系。本论文的研究改变了传统实验室中多肽研究的方法论,为多肽研究开辟了新的途径,并为未来相关领域的发展提供了全新的解决方案。 结果表明:在多肽和二级结构成分分析过程中,在AAC中,L残基对于多肽二级结构种类影响最大,其次K、P残基影响居中;在DPC中,KK和LK这两种二肽组合对于多肽二级结构种类影响最大;在ATC中,氢(H)含量对于二级结构α-helix形成影响明显高于其他两种二级结构;在PCP中,小型残基(small)和非极性(unpolar)对于多肽二级结构种类影响最大。在多肽和二级结构模型预测过程中,通过单个特征和混合特征的性能对比,最终选择包含三个特征(AAC、PCP、DPC)作为预测模型(SVMSS)。 在多肽和自组装形貌成分分析过程中:在AAC中,K残基对于多肽自组装相貌结构种类影响最大,其次A、F、I、L残基影响居中;在DPC中,DPC特征对多肽二级结构种类影响远高于对多肽自组装形貌的影响;在ATC中,多肽中氢(H)含量对于水凝胶形貌结构的形成的影响尤为明显;在PCP中,疏水性(HP)对于多肽自组装形貌结构种类影响最大,其次是相对分子质量。在多肽和多肽自组装形貌模型预测过程中,择包含两个特征(AAC、ATC)和包含两个特征(ATC、PCP)分别作为预测模型(XGBM)和预测模型(SVMM)。

关键词

多肽自组装/构效关系/机器学习

引用本文复制引用

授予学位

硕士

学科专业

材料科学与工程

导师

谢建军

学位年度

2024

学位授予单位

中南林业科技大学

语种

中文

中图分类号

Q5
段落导航相关论文