超輕量級中文OCR,支援豎排文字識別、ncnn推理,總模型僅17M

  • 2020 年 3 月 17 日
  • 筆記

整理 | AI科技大本營

光學字元識別(OCR)技術已經得到了廣泛應用。比如發票上用來識別關鍵字樣,搜題App用來識別書本上的試題。

近期,這個叫做chineseocr_lite的OCR項目開源了,這是一個超輕量級中文ocr,支援豎排文字識別,支援 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 總模型僅17M。

目前,這個開源項目已在GitHub上標星2400+。

這個項目基於chineseocr與psenet實現中文自然場景文字檢測及識別,環境是linux/macos。

以下為可實現的功能:

  • 提供輕量的 backone 檢測模型 psenet(8.5M),crnn_lstm_lite (9.5M) 和行文本方向分類網路(1.5M)
  • 任意方向文字檢測,識別時判斷行文本方向
  • crnncrnn_lite lstmdense識別(ocr-dense和ocr-lstm是搬運chineseocr 的)
  • 支援豎排文本識別
  • ncnn實現psenet(未實現核擴展)
  • ncnn實現crnn_dense(改變了全連接為conv1x1)
  • ncnn實現shuuflenev2角度分類網路
  • ncnn實現ocr整個流程

最近,項目作者對更新了可實現的功能。

  • nihui大佬實現的crnn_lstm推理
  • 升級crnn_lite_lstm_dw.pth模型crnn_lite_lstm_dw_v2.pth , 精度更高
  • 提供豎排文字樣例以及字體庫(旋轉90度的字體)

字體樣式

生成的豎排文本樣例

識別效果展示:

ncnn檢測識別展示(x86 cpu 單進程)

項目地址:https://github.com/ouyanghuiyu/chineseocr_lite

【end】