Skip to main content
PaddleOCR vise à créer des outils d’OCR multilingues, performants, de pointe et pratiques, afin d’aider les utilisateurs à entraîner de meilleurs modèles et à les mettre en pratique avec PaddlePaddle. PaddleOCR prend en charge un large éventail d’algorithmes de pointe liés à l’OCR et a développé des solutions industrielles. PaddleOCR propose désormais une intégration W&B pour consigner les métriques d’entraînement et d’évaluation, ainsi que les points de contrôle du modèle et les métadonnées correspondantes.

Exemple de blog et de Colab

Lire ici pour découvrir comment entraîner un modèle avec PaddleOCR sur le jeu de données ICDAR2015. Cet exemple inclut également un Google Colab, et vous pouvez consulter le tableau de bord W&B correspondant en direct ici. Une version chinoise de ce blog est également disponible ici : W&B对您的OCR模型进行训练和调试

Inscrivez-vous et créez une clé API

Une clé API permet à votre machine de s’authentifier auprès de W&B. Vous pouvez générer une clé API à partir de votre profil.
Pour une méthode plus directe, créez une clé API en accédant directement aux Paramètres utilisateur. Copiez immédiatement la clé API nouvellement créée et conservez-la dans un endroit sûr, par exemple dans un gestionnaire de mots de passe.
  1. Cliquez sur l’icône de votre profil dans le coin supérieur droit.
  2. Sélectionnez Paramètres utilisateur, puis faites défiler la page jusqu’à la section Clés API.

Installez la bibliothèque wandb et connectez-vous

Pour installer la bibliothèque wandb localement et vous connecter :
  1. Définissez la variable d’environnement WANDB_API_KEY en lui attribuant votre clé API.
    export WANDB_API_KEY=<your_api_key>
    
  2. Installez la bibliothèque wandb et connectez-vous.
    pip install wandb
    
    wandb login
    

Ajoutez wandb à votre fichier config.yml

PaddleOCR nécessite que les variables de configuration soient fournies dans un fichier YAML. L’ajout de l’extrait suivant à la fin du fichier de configuration YAML journalisera automatiquement toutes les métriques d’entraînement et de validation dans un tableau de bord W&B, ainsi que les points de contrôle du modèle :
Global:
    use_wandb: True
Tout autre argument facultatif que vous souhaitez transmettre à wandb.init() peut également être ajouté dans la section wandb du fichier YAML :
wandb:  
    project: CoolOCR  # (facultatif) c'est le nom du projet wandb 
    entity: my_team   # (facultatif) si vous utilisez une équipe wandb, vous pouvez passer le nom de l'équipe ici
    name: MyOCRModel  # (facultatif) c'est le nom du run wandb

Passez le fichier config.yml à train.py

Le fichier YAML est ensuite passé en argument au script d’entraînement disponible dans le dépôt PaddleOCR.
python tools/train.py -c config.yml
Une fois votre fichier train.py exécuté avec W&B activé, un lien est généré pour accéder à votre tableau de bord W&B :
Tableau de bord d'entraînement PaddleOCR
Tableau de bord de validation PaddleOCR
Tableau de bord du modèle de détection de texte

Retours ou problèmes

Si vous avez des retours ou rencontrez des problèmes avec l’intégration W&B, ouvrez une issue sur le GitHub de PaddleOCR ou envoyez un e-mail à support@wandb.com.