首页|基于深度神经网络的SSR分子标记对茶叶产地的溯源研究

基于深度神经网络的SSR分子标记对茶叶产地的溯源研究

扫码查看
[目的]对不同品种的茶叶进行区分和产地溯源,同时为其他植物分类提供参考依据.[方法]以简单重复序列标记(Simple sequence repeat,SSR)为基础,运用生物信息学的研究方法,对来自湖南、云南、福建和浙江省的 313 个茶叶样本的来源属地及 10 个外类群关系进行研究:首先,筛选出高质量的 54 个SSR位点,通过主成分分析(Principal component analysis,PCA),构建进化树,分析各省间茶叶样本的差异度;其次,通过比较线性回归模型、随机森林模型和深度神经网络(Deep neural network,DNN)模型的分类准确度,选择准确度最高的神经网络模型进行溯源模型构建及优化.[结果]4 个省的茶叶样本个体相对聚集,其中云南省的样本个体较其他省份差异大;福建、浙江、湖南的样本分别聚集,表明福建、浙江、湖南三省间茶叶差异显著,但有少量交叉,具有一定的相似遗传结构特性,亲缘关系较近.利用 3 种不同的模型对 54 个SSR分子标记矩阵构建模型,初步鉴定出线性回归模型准确率为 81%,随机森林模型准确率为 77%,而DNN模型准确率最高、为86%,由此可得出DNN模型对茶叶的分类效果最好.随后利用54个SSR分子标记和323个样本构建预测模型,并对一次训练的样本个数(Batch size)、训练的次数(Step size)、隐藏层层数及每层节点数进行优化,发现这 4个参数的优化结果当样本个数为 150、训练次数为 20000、隐藏层层数为 2 层时验证集和测试集的准确率最高、约 95%,即 2 层神经网络对茶叶分析效果最佳.[结论]基于深度神经网络的SSR分子标记为茶叶分类、产地溯源研究和茶叶育种等方面提供支持依据,构建的分类模型也可用于其他物种重测序数据的属地来源鉴定.
Research on SSR Molecular Markers for Traceability of Tea Origins Based on Deep Neural Network

teaSSRPCAdeep neural networktraceabilitymolecular marker

龚浩、张莉莉、陈富荣、林丽霞、陈意君、张乐、孙春莲、孙键

展开 >

惠州学院生命科学学院,广东 惠州 516007

惠州学院经济管理学院,广东 惠州 516007

茶叶 SSR PCA 深度神经网络 溯源 分子标记

广东省科技创新战略专项基金惠州学院教授、博士启动项目

pdjh2023b05002021JB017

2023

广东农业科学
广东省农业科学院 华南农业大学

广东农业科学

CSTPCD
影响因子:0.556
ISSN:1004-874X
年,卷(期):2023.50(9)
  • 17