超輕量級中文OCR,支援豎排文字識別、ncnn推理,總模型僅17M
- 2020 年 3 月 17 日
- 筆記
光學字元識別(OCR)技術已經得到了廣泛應用。比如發票上用來識別關鍵字樣,搜題App用來識別書本上的試題。
近期,這個叫做chineseocr_lite的OCR項目開源了,這是一個超輕量級中文ocr,支援豎排文字識別,支援 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 總模型僅17M。
目前,這個開源項目已在GitHub上標星2400+。
這個項目基於chineseocr與psenet實現中文自然場景文字檢測及識別,環境是linux/macos。
以下為可實現的功能:
- 提供輕量的 backone 檢測模型 psenet(8.5M),crnn_lstm_lite (9.5M) 和行文本方向分類網路(1.5M)
- 任意方向文字檢測,識別時判斷行文本方向
- crnncrnn_lite lstmdense識別(ocr-dense和ocr-lstm是搬運chineseocr 的)
- 支援豎排文本識別
- ncnn實現psenet(未實現核擴展)
- ncnn實現crnn_dense(改變了全連接為conv1x1)
- ncnn實現shuuflenev2角度分類網路
- ncnn實現ocr整個流程
最近,項目作者對更新了可實現的功能。
- nihui大佬實現的crnn_lstm推理
- 升級crnn_lite_lstm_dw.pth模型crnn_lite_lstm_dw_v2.pth , 精度更高
- 提供豎排文字樣例以及字體庫(旋轉90度的字體)
字體樣式

生成的豎排文本樣例

識別效果展示:

ncnn檢測識別展示(x86 cpu 單進程)

項目地址:https://github.com/ouyanghuiyu/chineseocr_lite
【end】