来自 科技 2020-07-26 13:39 的文章

百度开源超轻量中英文OCR模型爆红

光学字符识别(OCR)是指电子配备(例如扫描仪或数码相机)查看纸上打印的字符,颠末检测暗、白的内容注定其状态,然后用字符辨认办法将外形翻译成合计机笔墨的历程。

前数月,猿妹曾与人人分享过一个抢手的中文OCR项目———chine搜索引擎优化cr_lite。这两天猿妹才知道,baidu也开源了一款超轻量级中文OCR,总模子大小仅8.6M,只要chineseocr_lite,那真真是超轻量级此外神级OCR。

PaddleOCR旨在产一套雄厚、领先、且合用的OCR东西库,助力运用者训练出更好的模子,赞成iOS与Android琐屑,功能云云完整绝对,难怪霸榜Github热榜:

大小只有8.6M!百度开源超轻量中英文OCR模型爆红Github

 

PaddleOCR存在如下特性:

  • 超轻量级中文OCR模型,总模子仅8.6M
  • 运用通用中文OCR模子
  • 多种意料推理部署贪图,席卷管事部署和端侧部署
  • 多种文本检测锻炼算法,EAST、DB
  • 多种文本辨认熬炼算法,Rosetta、CRNN、STAR-Net、RARE
  • 可运转于Linux、Windows、MacOS等多种琐细

说了这么多,还是共同来看看功效吧,先来看看普片中文OCR成就显示:

大小只有8.6M!百度开源超轻量中英文OCR模型爆红Github

 

再来看看超轻量级中文OCR成效显露,岂论是横排笔墨照常竖排笔墨,凡是不在话下的,况且识别切确率相称高。