Skip to main content
PaddleOCR は、PaddlePaddle で実装され、ユーザーがより優れたモデルをトレーニングして実運用に活用できるよう支援する、多言語対応の高機能で先進的かつ実用的な OCR ツールの開発を目指しています。PaddleOCR は、OCR に関連するさまざまな最先端アルゴリズムをサポートしており、産業向けソリューションも開発してきました。現在の PaddleOCR には、トレーニングおよび評価のメトリクスに加え、対応するメタデータ付きのモデル チェックポイントをログするための W&B インテグレーションが用意されています。

ブログと Colab の例

こちらでは、PaddleOCR を使って ICDAR2015 データセットでモデルをトレーニングする方法を紹介しています。あわせて Google Colab も用意されており、対応するライブの W&B ダッシュボードは こちら から利用できます。なお、このブログの中国語版もあります: W&B对您的OCR模型进行训练和调试

サインアップしてAPIキーを発行する

APIキーは、マシンをW&Bに認証するために使用します。APIキーはユーザープロフィールから発行できます。
より手早く行うには、User Settings に直接アクセスしてAPIキーを作成してください。新しく作成したAPIキーはすぐにコピーし、パスワードマネージャーなどの安全な場所に保存してください。
  1. 右上にあるユーザープロフィールアイコンをクリックします。
  2. User Settings を選択し、API Keys セクションまでスクロールします。

wandb ライブラリをインストールしてログインする

wandb ライブラリをローカルにインストールしてログインするには、次の手順に従います。
  1. WANDB_API_KEY 環境変数 に APIキーを設定します。
    export WANDB_API_KEY=<your_api_key>
    
  2. wandb ライブラリをインストールしてログインします。
    pip install wandb
    
    wandb login
    

config.yml ファイルに wandb を追加する

PaddleOCR では、設定変数を YAML ファイルで指定する必要があります。設定用 YAML ファイルの末尾に次のスニペットを追加すると、すべてのトレーニングおよび検証メトリクスが、モデル チェックポイントとともに W&B ダッシュボードへ自動的にログされます。
Global:
    use_wandb: True
wandb.init() に渡したい追加のオプション引数は、yaml ファイルの wandb ヘッダー配下にも追加できます。
wandb:  
    project: CoolOCR  # (optional) wandb プロジェクト名 
    entity: my_team   # (optional) wandb チームを使用している場合、チーム名をここに指定できます
    name: MyOCRModel  # (optional) wandb run の名前

config.yml ファイルを train.py に渡す

この YAML ファイルは、PaddleOCR リポジトリにあるトレーニングスクリプトに引数として渡されます。
python tools/train.py -c config.yml
train.py ファイルを W&B を有効にして実行すると、W&B ダッシュボードに移動するリンクが生成されます。
PaddleOCRトレーニングダッシュボード
PaddleOCR検証ダッシュボード
テキスト検出モデルのダッシュボード

フィードバックや問題

W&B インテグレーションについてフィードバックや問題がある場合は、PaddleOCR GitHub で issue を登録するか、support@wandb.com までメールでご連絡ください。