ppReader-Kernel

Intro

Core identification module of AI powerful point reading system platform.

Usage

硬件:

Windows10、GPU:nvdia GTX 1060 、普通RBG相机

软件:

  • conda
  • Python 3.7
  • CUDA 10.2
  • cuDNN7.6.5
  • mediapipe 0.8.9
  • Paddlepaddle 2.2

使用步骤:

  1. 满足硬件条件(需要GPU)和软件条件
  2. 安装PaddleDetection:根据官网安装
  3. 安装PaddleOCR:根据官网安装
  4. 下载PaddleDetection 识别模型,并deploy后(查看官网教程:Python端预测部署),将生成的infer_cfg.yml, model.pdiparams, model.pdiparams.info, model.pdmodel文件放到baidu_pp_detection/models下,类似这样:

推荐下载cascade_rcnn_dcn_r101_vd_fpn_gen_server_side模型,它支持676个类别识别(详情查看这里),且经过我的测试,速度较好。

  1. 下载OCR推理模型,解压后分别放到baidu_pp_ocr/models/文件夹下,类似这样:

文本检测模型推荐下载ch_PP-OCRv2_det_infer,文本识别模型推荐下载ch_PP-OCRv2_rec_infer

  1. 运行python demo.py即可实时离线识别和OCR。

ToDo

  • Basic Model
  • Backbone Design
  • Parameters Test
  • Pruning and Quantification
  • Deployment

GitHub

View Github