来自 科技 2020-07-26 13:39 的文章
百度开源超轻量中英文OCR模型爆红
光学字符识别(OCR)是指电子配备(例如扫描仪或数码相机)查看纸上打印的字符,颠末检测暗、白的内容注定其状态,然后用字符辨认办法将外形翻译成合计机笔墨的历程。
前数月,猿妹曾与人人分享过一个抢手的中文OCR项目———chine搜索引擎优化cr_lite。这两天猿妹才知道,baidu也开源了一款超轻量级中文OCR,总模子大小仅8.6M,只要chineseocr_lite,那真真是超轻量级此外神级OCR。
PaddleOCR旨在产一套雄厚、领先、且合用的OCR东西库,助力运用者训练出更好的模子,赞成iOS与Android琐屑,功能云云完整绝对,难怪霸榜Github热榜:
PaddleOCR存在如下特性:
- 超轻量级中文OCR模型,总模子仅8.6M
- 运用通用中文OCR模子
- 多种意料推理部署贪图,席卷管事部署和端侧部署
- 多种文本检测锻炼算法,EAST、DB
- 多种文本辨认熬炼算法,Rosetta、CRNN、STAR-Net、RARE
- 可运转于Linux、Windows、MacOS等多种琐细
说了这么多,还是共同来看看功效吧,先来看看普片中文OCR成就显示:
再来看看超轻量级中文OCR成效显露,岂论是横排笔墨照常竖排笔墨,凡是不在话下的,况且识别切确率相称高。
作者:admin