科技与创新2022,Issue(7) :136-138.DOI:10.15913/j.cnki.kjycx.2022.07.040

基于埃尔米特插值的任意形状文字检测技术

张高明 仝明磊
科技与创新2022,Issue(7) :136-138.DOI:10.15913/j.cnki.kjycx.2022.07.040

基于埃尔米特插值的任意形状文字检测技术

张高明 1仝明磊1
扫码查看

作者信息

  • 1. 上海电力大学电子与信息工程学院,上海201306
  • 折叠

摘要

自然场景中的文字常表现为多种样式(水平、倾斜、弯曲).针对常规矩形检测框不能准确表示弯曲文字的问题,提出一种运用埃尔米特曲线表示任意形状文字的方法,改进后的模型只需预测文字区域4个角点的坐标以及对应位置处的斜率,即可根据埃尔米特曲线进行插值,准确表示图像中文字的位置信息.此外,在分类任务中增加文字实例质心预测分支,联合分类结果和质心预测结果,增大靠近文字实例中心处的分类预测值,减小远离中心处的分类预测值,提升模型准确率.实验部分,在标准数据集CTW1500进行的对比测试结果表明,埃尔米特曲线能够较好地表示任意形状文字区域.

关键词

埃尔米特曲线/目标检测/自然场景/文字检测

引用本文复制引用

出版年

2022
科技与创新
中国计算机用户协会

科技与创新

ISSN:1008-0570
被引量1
参考文献量10
段落导航相关论文