OCR( Optical Character Recognition,光学字符识别),是计算机视觉领域的重要研究内容之一,在实际生产环境中具有巨大价值。
传统的光学字符识别技术是一个经典的模式识别问题,包括对图片的预处理、特征提取、利用分类器分类等几个步骤,已经形成了较为完善的技术体系。
OCR技术流程
OCR技术发展历史:
1929年德国人 Tausheck取得了光学字符识别的专利,之后各国逐渐开始针对OCR技术进行研究。早期的研究内容主要是针对识別方法的理论研究,后来开始针对简单的0~9数字进行识别。直到1966年IBM公司的 Casey和Nagy才开始了针对汉字等复杂字符的识别进行研究,并且使用模板匹配的方法识别了1000个印刷体汉字。20世纪70年代初日本的学者也开始了汉字识别研究,其中有代表性的成果有1977年东芝综合研究所研制的可以识别2000个单体印刷汉字的OCR识别系统。
中国在OCR技术方面的研究工作起步较晚,直到70年代才逐渐开展了对于光学字符识别的研究。我国在1986年提出“863”高新科技研究计划,“863”计划的信息领域课题组织了清华大学、北京信息工程学院、沈阳自动化所三家科研单位展开中文OCR的研发工作,将中国的汉字识别的研究进入一个实质性的阶段,并由清华大学率先推出了国内最早的OCR产品。早期的OCR技术研究是基于模式识别的基础上进行的,模式识别的每一个模块都需要很好的设计,才能使整个系统达到较好的识别效果。
随着近年深度学习的不断发展,基于卷积神经网络的OCR技术打破了传统OCR技术的框架,在识别效率以及准确率上都有了质的飞跃。国际文档分析与识别大会( international conference ondocument analysis and recognition,ICDAR)于2003年大会设立“Robust Reading Competitions”,该竞赛主要评测和检验自然场景、网络图片、复杂视频文本自动提取与智能识别最新技术的性能,并设立了丰厚的奖金。该竞赛极大地促进了OCR技术的发展,目前已经成为OCR技术研究进展重要的国际赛事及标准。由于竞赛强大,实际应用性、高技术难度、诸多科研院校、科技公司都参与其中,目前已有89个国家的3500多支队伍参与。
OCR技术的发展前景一片繁荣。
*内容来源于《光学字符识别综述》*