查看更多>>摘要:利用物种间血液成分的差异来识别物种,对生物医学、医疗健康、海关、刑侦、食品安全、野生动物保护等工作十分重要.但目前的研究都是针对群体细胞展开,忽略了单细胞的异质性,开展基于单细胞的血液光谱分类方法研究非常迫切.在此提出了一种基于荧光光镊和机器学习的单细胞血液分类方法,利用光镊实现了单细胞捕获,通过荧光光谱检测系统获得了单细胞荧光光谱数据,并基于机器学习方法实现了准确分类.首先,设计并搭建了一套荧光光镊系统,实现了单细胞捕获和荧光光谱检测.然后,制备了马、猪、犬、鸡四种动物的红细胞稀释液,以440 nm激光作为荧光激发光源,获得了四个物种每种100条、共计400条荧光光谱数据,并进行了背景去除、平滑、归一化的预处理,消除了信号中的噪声干扰.随后,建立了随机森林分类模型,分析了当抽取特征数k=20时,模型中树的棵数与预测准确率之间的关系,当决策树m=500时,分类正确率趋于稳定,有很高的分类正确率和运行效率.进一步地,设定样本数据的30%作为测试集、70%为训练集,计算不同波长与特征重要性之间的关系,得到了 10个分类准确率,并取平均值作为模型分类的准确率,测试集最终准确率达到93.1%,方差为0.31%.最后,计算了混淆矩阵,对模型预测精度进行了评价,鸡的分类正确率最高,马的分类正确率最低.分析表明,对分类有重要贡献的物质分别是卟啉类物质、血红素和黄素腺嘌呤二核苷酸.总之,研究表明,将荧光光镊与机器学习方法相结合,可实现单细胞水平的血液分类,较高的分类正确率验证了这种方法的可行性和有效性.同时,该方法不需要过多样品就能满足建模需求,避免了因浓度低带来的荧光自吸收强度过低等问题,具有快速、准确分类的优点,具有非常重要的潜在应用价值.