在海洋工程类项目质量管理过程中,为便于后期竣工资料管理如文件信息追溯、查找,同时形成企业历史项目数据库,时常需要将纸质文件转录为电子数据.传统处理方法中,很大一部分纸版报告受限于不同专业内容,格式复杂多样,只能由人工手动转录完成,其效率、时效性和准确度越来越难以满足当下企业生产需求.因此,一种可直接由纸版文件转为电子数据的方法将节省大量人工录入成本,进一步丰富完善企业完工项目数据库.基于机器学习中的神经网络模型CRNN进行文字识别,完成了输入图像优化处理、文本定位分割、生产环境数据集训练等工作,最终在实际应用场景数据测试中达到了 93%的准确度,能满足企业实际生产需要.