乙型病毒性肝炎是威胁全人类健康的世界性疾病,我国的乙型肝炎病毒(HepatitisBvirus,HBV)感染者高达8600.7万,而目前已感染者难以彻底治愈,需终生服药,所以急需研制更有效的抗病毒药物或治疗性疫苗。乙肝表面抗原(HepatitisBVirussurfaceAntigen,HBsAg)是HBV的重要组成之一,不仅是临床上重要的诊疗标志物,也是乙肝疫苗的主要成分。深入探究HBsAg的工作机制,需要高分辨的三维结构信息,但由于HBsAg的结构均一性较差,目前仍未解析出其高分辨率三维结构。 冷冻电镜单颗粒重构技术,不仅能重构高分辨率的三维结构,并且在样本制备、可解析范围等方面具备极大优势,因此也成为了HBsAg结构解析的重要方法。单颗粒重构包括颗粒挑选、二维聚类和三维重构等环节,其中二维聚类能够生成高信噪比的类平均图像便于观察样品,发现形态特征、对称性等关键结构信息,对后续三维重构具有重要指导意义。 本文通过深入分析HBsAg结构解析的难点,结合单颗粒重构过程,重点围绕着聚类算法的探究、建立和初步应用,开展研究工作,具体内容有: (1)建立HBsAg的冷冻电镜单颗粒图像数据集,并应用主流聚类算法进行初步探究。制备了HBsAg冷冻样品,通过电镜图像采集、预处理和颗粒挑选,构建了67797张HBsAg颗粒图像的数据集;通过4种主流聚类算法对其进行聚类分析,初步了解HBsAg的形态特征,验证了数据集的可靠性;同时,对聚类结果进行分析,发现了类内误差大、类间颗粒分布失衡(前10类占据94%以上)等问题,生成的类平均图像质量较差; (2)基于前述聚类探究的问题分析和HBsAg形态理解,针对性地提出了HBsAg环形特征(HBsAgRingFeature,H-RF)、动态降噪变分自编码器(DynamicDenoisingVariationalAutoencoder,DDVAE)与平衡K-Means(BalancedK-Means,BK-Means)算法,而后结合三者提出一种面向HBsAg的冷冻电镜图像聚类方案H-RDK; (3)为客观评价H-RDK的可靠性和性能,首先对已知结构进行投影并加入随机噪声,构造了信噪比为0.5、0.1、0.05的模拟数据集进行验证测试,从而通过准确率与互信息对聚类结果进行直观评价,H-RDK在三个数据集上的性能均优于常用的三种聚类算法; (4)将H-RDK应用于前述构建的HBsAg图像数据集,得到了更清晰的降噪图像和类平均图像;结合图像质量与形态特征对类平均图像进行量化评价,其清晰度和边缘刺突分布较前述主流算法均有提升;结合H-RDK的聚类结果,通过主流重构软件EMAN2进行初步的重构测试,得到一个分辨率为16.89(A)的HBsAg三维结构,具有较好的探索潜力。