OCR字符识别技术发展史

发布时间：2022-06-28 11:54:26 作者：admin 阅读量：3582

OCR( Optical Character Recognition，光学字符识别)，是计算机视觉领域的重要研究内容之一，在实际生产环境中具有巨大价值。

传统的光学字符识别技术是一个经典的模式识别问题，包括对图片的预处理、特征提取、利用分类器分类等几个步骤，已经形成了较为完善的技术体系。

OCR技术流程

OCR技术发展历史：

1929年德国人 Tausheck取得了光学字符识别的专利，之后各国逐渐开始针对OCR技术进行研究。早期的研究内容主要是针对识別方法的理论研究，后来开始针对简单的0~9数字进行识别。直到1966年IBM公司的 Casey和Nagy才开始了针对汉字等复杂字符的识别进行研究，并且使用模板匹配的方法识别了1000个印刷体汉字。20世纪70年代初日本的学者也开始了汉字识别研究，其中有代表性的成果有1977年东芝综合研究所研制的可以识别2000个单体印刷汉字的OCR识别系统。

中国在OCR技术方面的研究工作起步较晚，直到70年代才逐渐开展了对于光学字符识别的研究。我国在1986年提出“863”高新科技研究计划,“863”计划的信息领域课题组织了清华大学、北京信息工程学院、沈阳自动化所三家科研单位展开中文OCR的研发工作，将中国的汉字识别的研究进入一个实质性的阶段，并由清华大学率先推出了国内最早的OCR产品。早期的OCR技术研究是基于模式识别的基础上进行的，模式识别的每一个模块都需要很好的设计，才能使整个系统达到较好的识别效果。

随着近年深度学习的不断发展，基于卷积神经网络的OCR技术打破了传统OCR技术的框架，在识别效率以及准确率上都有了质的飞跃。国际文档分析与识别大会( international conference ondocument analysis and recognition,ICDAR)于2003年大会设立“Robust Reading Competitions”,该竞赛主要评测和检验自然场景、网络图片、复杂视频文本自动提取与智能识别最新技术的性能，并设立了丰厚的奖金。该竞赛极大地促进了OCR技术的发展,目前已经成为OCR技术研究进展重要的国际赛事及标准。由于竞赛强大，实际应用性、高技术难度、诸多科研院校、科技公司都参与其中，目前已有89个国家的3500多支队伍参与。

OCR技术的发展前景一片繁荣。

*内容来源于《光学字符识别综述》*

关键字：OCR技术光学字符识别字符检测

典型的机器视觉系统构成

关于机器视觉技术

推荐阅读

热门标签

玻璃检测

缺陷检测

表面缺陷检测

视觉检测技术

木制品检测

OCR字符识别技术发展史