国家学术搜索
登录
注册
中文
EN
首页
|
Hadoop平台下的并行文字识别技术研究
Hadoop平台下的并行文字识别技术研究
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
在信息技术及计算机日益普及的今天,利用OCR(光学字符识别)技术将图片类型的文字材料方便、快捷地输入到计算机中并转化为文字已经广泛应用于各行各业,但随着文件数量的急剧增长,在面对海量图片数据时,逐个逐页文件的单机识别模式已逐渐不能满足使用者的需求,分布式系统是解决海量信息存储及处理的有效方式.通过分析HDFS的特点,使用MapReduce这一机制,提出利用Tesseract-OCR引擎对文字图像进行并行识别处理的方法,为今后使用OCR技术进行海量图片识别处理提供了借鉴参考.
外文标题:
Study of the parallel character recognition technology under Hadoop platform
收起全部
展开查看外文信息
作者:
孟帅
展开 >
作者单位:
国防科学技术大学,湖南省长沙市410073
关键词:
HDFS
MapReduce
OCR
并行
识别
出版年:
2014
中国电子商情·通信市场
中国电子器材总公司
中国电子商情·通信市场
影响因子:
0.03
ISSN:
1006-6675
年,卷(期):
2014.
(1)
参考文献量
1