计算机技术与发展2022,Vol.32Issue(7) :70-74.DOI:10.3969/j.issn.1673-629X.2022.07.012

基于Spark的花卉图像分类研究

Study of Flower Image Classification Based on Spark

侯向宁 徐草草 杨井荣
计算机技术与发展2022,Vol.32Issue(7) :70-74.DOI:10.3969/j.issn.1673-629X.2022.07.012

基于Spark的花卉图像分类研究

Study of Flower Image Classification Based on Spark

侯向宁 1徐草草 1杨井荣1
扫码查看

作者信息

  • 1. 成都理工大学 工程技术学院 电子信息与计算机工程系,四川 乐山614000
  • 折叠

摘要

针对传统单机模式对海量花卉图像数据分类效率低下以及现有网络模型对花卉分类准确率不高的问题,首先通过搭建Hadoop及Spark分布式计算框架,利用HDFS存储海量花卉图像数据,Spark进行分布式并行计算,HBASE存储相关的集群参数及网络模型参数.其次在对现有的VGG16网络模型进行研究的基础上,将选择性软注意力机制引入VGG16网络对其进行改进,使VGG16网络可以从不同的感受野获取信息,并使网络泛化能力变得更强.最终在Spark分布式计算框架中采用TensorFlowOnSpark技术,实现花卉图像特征提取、模型训练及分类测试的并行化,既降低了模型训练的时间,同时也提高了花卉分类的准确率.实验表明,与未引入SK(选择性内核)单元的VGG16模型相比,花卉分类的准确率提高了近15.3个百分点.实验还表明,分布式计算有利于负载均衡,极大地降低了模型训练及分类测试的耗时,能进一步提高海量花卉数据分类的效率.

关键词

花卉分类/Hadoop/Spark/VGG16/TensorFlowOnSpark/SK单元

引用本文复制引用

基金项目

四川省教育自然科学研究重点项目(18ZA0077)

乐山市科技重点项目(19GZD055)

成都理工大学工程技术学院项目(C122020006)

出版年

2022
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量2
参考文献量5
段落导航相关论文