PaddleOCR

PaddleOCR vise à créer des outils d’OCR multilingues, performants, de pointe et pratiques, afin d’aider les utilisateurs à entraîner de meilleurs modèles et à les mettre en pratique avec PaddlePaddle. PaddleOCR prend en charge un large éventail d’algorithmes de pointe liés à l’OCR et a développé des solutions industrielles. PaddleOCR propose désormais une intégration W&B pour consigner les métriques d’entraînement et d’évaluation, ainsi que les points de contrôle du modèle et les métadonnées correspondantes.

Exemple de blog et de Colab

Lire ici pour découvrir comment entraîner un modèle avec PaddleOCR sur le jeu de données ICDAR2015. Cet exemple inclut également un Google Colab, et vous pouvez consulter le tableau de bord W&B correspondant en direct ici. Une version chinoise de ce blog est également disponible ici : W&B对您的OCR模型进行训练和调试 Une clé API permet à votre machine de s’authentifier auprès de W&B. Vous pouvez générer une clé API à partir de votre profil.

Pour une méthode plus directe, créez une clé API en accédant directement aux Paramètres utilisateur. Copiez immédiatement la clé API nouvellement créée et conservez-la dans un endroit sûr, par exemple dans un gestionnaire de mots de passe.

Cliquez sur l’icône de votre profil dans le coin supérieur droit.
Sélectionnez Paramètres utilisateur, puis faites défiler la page jusqu’à la section Clés API.

Installez la bibliothèque `wandb` et connectez-vous

Pour installer la bibliothèque wandb localement et vous connecter :

Ligne de commande
Python
Python notebook

Définissez la variable d’environnement WANDB_API_KEY en lui attribuant votre clé API.
```
export WANDB_API_KEY=<your_api_key>
```
Installez la bibliothèque wandb et connectez-vous.
```
pip install wandb

wandb login
```

pip install wandb

import wandb
wandb.login()

!pip install wandb

import wandb
wandb.login()

Ajoutez wandb à votre fichier `config.yml`

PaddleOCR nécessite que les variables de configuration soient fournies dans un fichier YAML. L’ajout de l’extrait suivant à la fin du fichier de configuration YAML journalisera automatiquement toutes les métriques d’entraînement et de validation dans un tableau de bord W&B, ainsi que les points de contrôle du modèle :

Global:
    use_wandb: True

Tout autre argument facultatif que vous souhaitez transmettre à wandb.init() peut également être ajouté dans la section wandb du fichier YAML :

wandb:  
    project: CoolOCR  # (facultatif) c'est le nom du projet wandb 
    entity: my_team   # (facultatif) si vous utilisez une équipe wandb, vous pouvez passer le nom de l'équipe ici
    name: MyOCRModel  # (facultatif) c'est le nom du run wandb

Passez le fichier `config.yml` à `train.py`

Le fichier YAML est ensuite passé en argument au script d’entraînement disponible dans le dépôt PaddleOCR.

python tools/train.py -c config.yml

Une fois votre fichier train.py exécuté avec W&B activé, un lien est généré pour accéder à votre tableau de bord W&B :

Tableau de bord d'entraînement PaddleOCR

Tableau de bord du modèle de détection de texte

Retours ou problèmes

Si vous avez des retours ou rencontrez des problèmes avec l’intégration W&B, ouvrez une issue sur le GitHub de PaddleOCR ou envoyez un e-mail à support@wandb.com.

Welcome to W&B

Products

Platform Details

Resources

Exemple de blog et de Colab

Installez la bibliothèque `wandb` et connectez-vous

Ajoutez wandb à votre fichier `config.yml`

Passez le fichier `config.yml` à `train.py`

Retours ou problèmes

Welcome to W&B

Products

Platform Details

Resources

​Exemple de blog et de Colab

​Inscrivez-vous et créez une clé API

​Installez la bibliothèque wandb et connectez-vous

​Ajoutez wandb à votre fichier config.yml

​Passez le fichier config.yml à train.py

​Retours ou problèmes

Exemple de blog et de Colab

Inscrivez-vous et créez une clé API

Installez la bibliothèque `wandb` et connectez-vous

Ajoutez wandb à votre fichier `config.yml`

Passez le fichier `config.yml` à `train.py`

Retours ou problèmes