灵云OCR服务公安部打造最精准证照识别

      灵云科技11月8日消息:近日,捷通华声联手公安部,应用捷通华声与清华大学最新研发的新一代灵云OCR技术,共同打造可以自动识别身份证、护照、港澳通行证、台胞证等多种证件信息的智能证照信息读取设备,实现证照识别、自动分类准确率的跨越式进步,大大提升了酒店、边检、交通等众多领域对证件信息录入的准确率和效率。

证照识别市场需求旺盛 如何实现精准识别是难点
      证件作为每个人社会身份的代表,是我们出门旅行、办理事务的必需品。在酒店旅客身份信息登记、海关通关证件检查、公安外籍人员管理、高铁民航护照识别、旅行社出境游护照信息登记等众多场景,都需要对大量的护照、身份证、港澳通行证等证件进行信息录入。

      传统的手工录入,由于录入速度慢、效率低、错误率难以降低,造成旅客排队、信息录入错误、旅客信息管理繁琐等负面影响,给旅客出行带来了不便。OCR技术,即光学字符识别,可以识别各类证照上的文字信息,无疑给证照信息批量录入带来了福音。
      但是,在证照的OCR识别过程中,面临着诸多难点:第一,由于证件整洁度不一,字符存在黏连,识读设备光照一致性、焦距变化等原因,造成字符成像质量难以保证;第二,护照等证件页面呈“V型”,成像倾斜,影响识别准确率;第三,证件种类繁多,如何实现对证照的自动、精准分类。上述3个因素,成为了目前市场上各类OCR识别设备难以提升证照识别准确率的主要原因。
 
深度学习 让灵云OCR技术达到世界领先水平
      传统的OCR技术难以在证照识别上取得突破,是因为它们要对图像进行繁杂的预处理和后处理工作,过于依赖图像处理算法对图像进行适应性调整和处理,只能识别“清晰、端正的文字”。
      今年9月,清华实验室与捷通华声科研团队基于最新的机器学习算法和深度学习训练集群,在充分研究拍照、扫描图像的特性后,收集和整理了海量的图像数据,从文本的定位到识别,采用了一体化的End-to-end模型结构和训练方法,推出了最新灵云文本引擎iRead 7.0 Text——新一代灵云OCR技术。
      该技术的推出,让机器不再只能识别“清晰、端正的文字”,还能识别“倾斜、相对模糊的文字”,并且支持更多的字体。这不但省去了主流方法繁杂的预处理和后处理工作,将模型训练时间从以月为单位降低到几天,更是将OCR技术的字正确率提高到99.9%,达到世界顶尖水平。
 
证照精准识别 自动分类 灵云OCR服务酒店、边检、交通等众多领域
      新一代灵云OCR技术成功解决了证照图像不清晰的难题,文字识别正确率达到99.9%,让证照识别设备能更从容的面对聚焦不精准、光线不足、证件整洁度低等问题。在证照自动分类方面,通过应用机器学习方法,证件分类准确率高达99%,证照整体识别正确率远超国内外其他OCR技术提供商,达到全球顶尖水平。

说明: D:Easy way20160927OCR升级灵云OCR实现突破2.jpg

      灵云OCR技术已广泛应用于证照、文档、票据、名片的识别。其中,证照识别全面支持身份证、驾驶证、行驶证、银行卡、营业执照、名片、护照、港澳通行证、回乡证、台胞证、大陆证、户口簿、居住证等全系列证照,已广泛服务于公安、金融、保险、证券、交通、旅游、边检等众多领域,打造精准、高效的证照自动化录入。
      新一代灵云OCR技术的推出,是清华大学与捷通华声科研团队的智慧结晶。清华大学早在上世纪90年代就推出了代表行业最高水平的中文OCR技术,是国内最早从事中文OCR技术研究与应用的高校。清华OCR技术已广泛服务于各行业、各领域,为中文OCR技术的发展做出了重大贡献。
此次捷通华声与公安部的合作,是新一代灵云OCR技术的威力初现。捷通华声愿携手各领域合作伙伴,共同推动新一代OCR技术的产业化普及,让文字录入更精准、更高效。

获得 Adobe Flash Player