软件学报1999,Vol.10Issue(11) :1216-1224.

一种鲁棒性的结构未知表格分析方法

A Robust Method for Unknown Structure Form Analysis

李星原 高文
软件学报1999,Vol.10Issue(11) :1216-1224.

一种鲁棒性的结构未知表格分析方法

A Robust Method for Unknown Structure Form Analysis

李星原 1高文2
扫码查看

作者信息

  • 1. 哈尔滨工业大学计算机科学与工程系,哈尔滨,1500;中国科学院计算技术研究所,北京,100080
  • 2. 中国科学院计算技术研究所,北京,100080
  • 折叠

摘要

模型未知表格的分析是表格识别中文本分析阶段的一个重要且具有挑战性的问题.目前的一般方法仅能容忍表格线的微小断线.文章提出一种基于抽取表格线的分析结构未知表格的策略.利用抽取的表格线的特征知识和局部约束可以选择一些有效边.在扫描水平和垂直表格线时,如果环绕边都有效,则产生一个矩形块,引入迭代可以更好地利用全局信息并使抽取结果满足约束关系.这种矩形块的抽取可以容忍表格线大的断线或不合适的分割,可以处理诸如嵌入矩形块的复杂结构.矩形块被抽取后,表格的其他部件可以通过搜索剩余的部分来抽取.表格测试实验证明,该方法在表格质量很差时仍可以很好地工作.

关键词

图像分析/文本分析/图像分割/表格分析/矩形提取/递归算法

引用本文复制引用

基金项目

国家自然科学基金()

国家自然科学基金()

教育部跨世纪优秀人才培养计划()

中国科学院"百人计划"()

出版年

1999
软件学报
中国科学院软件研究所,中国计算机学会

软件学报

CSCD北大核心
影响因子:2.833
ISSN:1000-9825
被引量4
参考文献量1
段落导航相关论文