首先创建环境,建议选择python 3.9 ,之前用3.12导致安装包报错

简单使用安装CPU版本即可,代码如下:

python -m pip install paddlepaddle -i https://mirror.baidu/pypi/simple

然后安装paddleocr

# 安装 paddleocr,推荐使用2.6版本
pip3 install "paddleocr>=2.6.0.3"
 
# 安装 图像方向分类依赖包paddleclas(如不需要图像方向分类功能,可跳过)
pip3 install paddleclas>=2.4.3

如果使用图片识别并生成Excel

执行如下代码即可

import os
import cv2
from paddleocr import PPStructure, save_structure_res

table_engine = PPStructure(layout=False, show_log=True)

save_folder = './output'
img_path = 'law.jpg'
img = cv2.imread(img_path)
result = table_engine(img)
save_structure_res(result, save_folder, os.path.basename(img_path).split('.')[0])

for line in result:
    line.pop('img')
    print(line)

识别效果如下: