PaddleOCR-Flask-deploy
                                
                                 PaddleOCR-Flask-deploy copied to clipboard
                                
                                    PaddleOCR-Flask-deploy copied to clipboard
                            
                            
                            
                        ✅Deploy PaddleOCR with flask | 利用Flask对PaddleOCR进行部署,方便调用
简介
PaddleOCR 旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。Flask是一个使用 Python编写的轻量级 Web 应用框架。本项目旨在将PaddleOCR部署在Flask上,方便调用。

目录说明
- caches:上传过来识别的图片
- post
	- test-post.py:服务请求代码
	- demo.jpg:测试图片
- templates:前端界面
- server.py:server端
本地使用
- 克隆下载本仓库代码;
- 安装好本地需要的环境(paddlepaddle、paddleocr、以及requirements.txt);
- 根据需求,修改server.py第97行IP(如果本地测试,建议127.0.0.1,如果云端部署,建议0.0.0.0);
- 在此文件夹下启用服务:
python server.py
'''
 * Debugger is active!
 * Debugger PIN: 109-572-001
 * Running on http://127.0.0.1:8090/ (Press CTRL+C to quit)
'''
- 根据输出访问:http://ip:8090/,如果页面可以访问,即表示服务正常启动,可以做请求;

- 进入post文件夹下,修改第4行url为上述输出url,修改第5行请求的图片名称,终端运行:
python test-post.py
'''
{
  "服务状态": "success",
  "识别时间": "3.2900s",
  "识别结果": [
    "健康宝",
    "2022年06月02日",
    "19:38:23",
    "未见异常②",
    "④核酸",
    "阴性",
    "时间",
    "#疫苗",
    "查看",
    "名",
    "姓",
    "李*",
    "身份证号",
    "61***",
    "**28",
    "查询时间",
    "06-0214:30",
    "失效时间",
    "06-0224:00",
    "返回首页",
  ]
}
'''
云端部署
- 修改代码IP;
- 放行服务器服务端口,如:8090;
在一台2核2G的服务器上,服务结果可在2s内返回。
参数说明
- use_angle_cls true设置使用方向分类器识别180度旋转文字;
- use_gpu false设置不使用GPU;
- 单独使用检测:设置rec为false;
- 单独使用识别:设置det为false;
- paddleocr默认使用PP-OCRv3模型(ocr_version=PP-OCRv3),如需使用其他版本可通过设置参数ocr_version,具体版本说明如下:
| 版本名称 | 版本说明 | 
|---|---|
| PP-OCRv3 | 支持中、英文检测和识别,方向分类器,支持多语种识别 | 
| PP-OCRv2 | 支持中英文的检测和识别,方向分类器,多语言暂未更新 | 
| PP-OCR | 支持中、英文检测和识别,方向分类器,支持多语种识别 | 
- PaddleOCR目前支持80个语种,可以通过修改lang参数进行切换,对于英文模型,指定lang=en,常用的多语言简写包括:
| 语种 | 缩写 | 语种 | 缩写 | 语种 | 缩写 | ||
|---|---|---|---|---|---|---|---|
| 中文 | ch | 法文 | fr | 日文 | japan | ||
| 英文 | en | 德文 | german | 韩文 | korean | ||
| 繁体中文 | chinese_cht | 意大利文 | it | 俄罗斯文 | ru | 
全部语种及其对应的缩写列表可查看多语言模型教程
服务请求
请求方法:POST、GET
请求URL: http://IP:8090/ocr
请求参数说明:
| 参数 | 值 | 
|---|---|
| file | 图像数据, base64编码,支持JPG、PNG、JPEG格式 | 
返回参数说明:
| 参数 | 值 | 
|---|---|
| 服务状态 | success:成功识别;faild:无法识别; | 
| 识别结果 | 列表格式,包含从图片中识别的所有文字信息 | 
| 识别时间 | 模型识别文字消耗时间 | 
代码请求示例:
import requests
import json
url = 'http://IP:8090/ocr'
files = {'file': open('./demo.jpg', 'rb')}
r = requests.post(url, files=files)
print(r.text)
TODO
- [ ] 即将支持PaddleOCR多应用部署;