首页|基于Spark的花卉图像分类研究

基于Spark的花卉图像分类研究

扫码查看
针对传统单机模式对海量花卉图像数据分类效率低下以及现有网络模型对花卉分类准确率不高的问题,首先通过搭建Hadoop及Spark分布式计算框架,利用HDFS存储海量花卉图像数据,Spark进行分布式并行计算,HBASE存储相关的集群参数及网络模型参数.其次在对现有的VGG16网络模型进行研究的基础上,将选择性软注意力机制引入VGG16网络对其进行改进,使VGG16网络可以从不同的感受野获取信息,并使网络泛化能力变得更强.最终在Spark分布式计算框架中采用TensorFlowOnSpark技术,实现花卉图像特征提取、模型训练及分类测试的并行化,既降低了模型训练的时间,同时也提高了花卉分类的准确率.实验表明,与未引入SK(选择性内核)单元的VGG16模型相比,花卉分类的准确率提高了近15.3个百分点.实验还表明,分布式计算有利于负载均衡,极大地降低了模型训练及分类测试的耗时,能进一步提高海量花卉数据分类的效率.
Study of Flower Image Classification Based on Spark

侯向宁、徐草草、杨井荣

展开 >

成都理工大学 工程技术学院 电子信息与计算机工程系,四川 乐山614000

花卉分类 Hadoop Spark VGG16 TensorFlowOnSpark SK单元

四川省教育自然科学研究重点项目乐山市科技重点项目成都理工大学工程技术学院项目

18ZA007719GZD055C122020006

2022

计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
年,卷(期):2022.32(7)
  • 2
  • 5