目录
前言
一、环境安装
Nvidia驱动
禁用开源驱动 Nouveau
卸载旧驱动
安装新驱动
reboot
nccl
专用源配置(NVIDIA官方)添加NVIDIA CUDA仓库
安装nccl开发包
验证安装结果
cuda-toolkit
cudnn
paddlepaddle-gpu
二、pp_ocr_det训练
三、pp_ocr_det验证
总结
前言
本文介绍如何安装PPOCR之文本检测模块依赖工具包,如何训练验证PPOCR-Det。平台为ubuntu20.04,其他平台改选相应的平台安装包即可,安装过程一致。
一、环境安装
Nvidia驱动
禁用开源驱动 Nouveau
sudo nano /etc/modprobe.d/blacklist-nouveau.conf
#blacklist-nouveau.conf 填入如下内容,保存退出
blacklist nouveau
options nouveau modeset=0
卸载旧驱动
注:如果全新安装,可跳过
#下列方法对于手动通过.sh安装的驱动也适用
sudo apt purge "*nvidia*" "*libnvidia*"
sudo apt autoremove
安装新驱动
#查看可用驱动版本可以执行ubuntu-drivers devices
sudo apt install nvidia-driver-570 #根据需要选择版本,不同版本驱动 CUDA版本也不同 570对应CUDA 12.8;
reboot
重启后执行nvidia-smi查看驱动情况
nccl
专用源配置(NVIDIA官方)添加NVIDIA CUDA仓库
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/3bf863cc.pub #适用于Ubuntu 20.04 (focal)
sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /" #适用于Ubuntu 20.04 (focal)
安装nccl开发包
sudo apt install libnccl2 libnccl-dev
验证安装结果
ldconfig -p | grep nccl # 检查库文件加载
nccl --version # 验证可执行文件,只安装lib的话,此命令缺失结果
cuda-toolkit
官方下载地址
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-8
安装完成后编辑~/.bashrc,添加如下两行
export PATH=/usr/local/cuda-12/bin${
PATH:+:${
PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
cudnn
官方下载地址下载:cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz
解压完成后,需要把头文件,库文件拷贝到指定目录
tar xf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz
sudo cp include/cudnn.h /usr/local/cuda-12.8/include
sudo cp lib/libcudnn* /usr/local/cuda-12.8/lib64
sudo chmod a+r /usr/local/cuda-12.8/include/cudnn.h /usr/local/cuda-12.8/lib64/libcudnn*
paddlepaddle-gpu
paddlepaddle分CPU和GPU两个版本,本文使用GPU版本。
pip install paddlepaddle-gpu #或者wheel下载https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
验证安装
import paddle
paddle.utils.run_check()
二、pp_ocr_det训练
训练分为server和mobile两个版本,本文用于嵌入式设备,选择mobile版本
参考:https://paddlepaddle.github.io/PaddleOCR/main/version3.x/module_usage/text_detection.html#411
python3 -m paddle.distributed.launch --gpus '0,1' tools/train.py
-c configs/det/PP-OCRv5/PP-OCRv5_mobile_det.yml
-o Global.pretrained_model=./PP-OCRv5_server_det_pretrained.pdparams
Train.dataset.data_dir=./ocr_det_dataset_examples
Train.dataset.label_file_list='[./ocr_det_dataset_examples/train.txt]'
Eval.dataset.data_dir=./ocr_det_dataset_examples
Eval.dataset.label_file_list='[./ocr_det_dataset_examples/val.txt]'
三、pp_ocr_det验证
#注意将pretrained_model的路径设置为本地路径。若使用自行训练保存的模型,请注意修改路径和文件名为{path/to/weights}/{model_name}。
# demo 测试集评估
python3 tools/eval.py -c configs/det/PP-OCRv5/PP-OCRv5_mobile_det.yml
-o Global.pretrained_model=output/PP-OCRv5_mobile_det/best_accuracy.pdparams
Eval.dataset.data_dir=./ocr_det_dataset_examples
Eval.dataset.label_file_list='[./ocr_det_dataset_examples/val.txt]'
总结
本文介绍PPOCR中用于文本检测的模块如何安装,训练,验证等。
暂无评论内容