360数科荣登OCR国际赛事榜首
中新经纬6月9日电 日前,360数科在ICDAR 2019 SROIE国际大赛OCR单项任务中,超越众多AI大咖拔得头筹。ICDAR(国际文档分析与识别大会)有着“OCR奥斯卡”之称,赛事兼具权威性与挑战性,目前已吸引148个国家的顶尖队伍参与。
360数科本次参加的文本识别算法大赛通道,一方面极其贴近真实业务场景,对企业技术应用效果提出了极高要求,一方面以Recall、Precision、Hmean为核心评价指标,考验企业技术精准度。此次成绩的获取,标志着360数科技术能力再次受到国际认可。
随着大数据、人工智能的蓬勃发展,OCR性能的不断提升为产业数字化催生的应用场景提供了坚实支撑。同时,覆盖移动端和云端的多样化服务载体,进一步加快了OCR的普及。然而,OCR技术所面对的挑战与其发展并存,弯曲文本、长文本、不同语种、生僻字符以及手写体文字识别等难点仍在寻求更好的解决方案。
360数科在本次竞赛中,提出了一种基于RARE改进的新文本识别算法,并与优化后的CRNN模型进行了模型融合,并在此基础上使用了带有初始值的center loss。除了模型优化外,360数科还利用大规模公开数据集用于预训练模型,并且生成了大量与训练集相同图像风格的仿真数据,在预训练模型的基础上进行finetune。最后,应用已训练完成的自然语言模型,纠正文本识别中的错误。
自2018年,360数科就开始积极探索如何将OCR技术应用于业务。目前已结合业务实际情况,建立了多个通用文档图像数据集,包括并不限学历认证、执业证书认证、票据识别、行驶证识别、驾驶证识别和营业执照等。目前该算法在上述业务场景字段精度均高达95%以上。
据360数科首席算法科学家费浩峻介绍,360数科一直把业务作为技术成长的最有力土壤,技术研究要植根于业务,并超前于业务,本次ICDAR竞赛便是对业务实践过程中技术积累的一个有效检验。未来,除了对端到端网路结构的进一步探索,如何设计更适用于移动端使用的轻量化模型也是公司OCR技术的重点研究方向,只有兼顾效率和精准度的模型才能更好服务于用户。当前,OCR技术已在金融、保险、医疗、交通、教育等诸多行业有了深入成熟的应用。未来随着传统行业的数字化转型,OCR应用范围和场景将进一步扩展,市场规模将进一步增大。360数科将在更多前沿技术探索中,以自身科技能力,壮大金融科技赋能实体的力量。
国际文档分析与识别大会 ICDAR( International Conference on Document Analysis and Recognition)自1991年开始,每两年一届。自2003年大会开始设立技术竞赛,ICDAR竞赛因其极高技术难度和强大实用性,一直是各大科研院校、科技公司的竞逐焦点,吸引国内外众多队伍参赛。(中新经纬APP)
- 标签:本站
- 编辑:兰心
- 相关文章
-
360数科荣登OCR国际赛事榜首
中新经纬6月9日电 日前,360数科在ICDAR 2019 SROIE国际大赛OCR单项任务中,超越众多AI大咖拔得头筹…
-
中国青少年足球联赛赛事组织工作方案(2022-2024年)发布
新华社北京6月1日电(记者公兵、肖世尧)由教育部、国家体育总局、中国足协共同研究制定的《中国青少年足球联赛赛事组织工作方案…
- 4月26日至30日北京暂停体育赛事、校外体育培训机构线下培训
- 蒲公英水可以消结节吗?女子长期饮用蒲公英茶,后来怎么样了?
- 进入12月中旬每天不是下雪就是雾霾,人们多吃经典菜,增强体质
- 什么是胎膜早破?胎膜早破有哪些危害?看完就懂了
- 30岁女人内分泌过多的原因有哪些?尽早发现,尽早治疗