spacy train pour suivre les métriques d’entraînement de votre modèle spaCy, ainsi que pour enregistrer et versionner vos modèles et jeux de données. Il suffit pour cela d’ajouter quelques lignes à votre configuration.
Inscrivez-vous et créez une clé API
Pour une méthode plus directe, créez une clé API en accédant directement aux Paramètres utilisateur. Copiez immédiatement la clé API nouvellement créée et conservez-la dans un endroit sûr, par exemple dans un gestionnaire de mots de passe.
- Cliquez sur l’icône de votre profil dans l’angle supérieur droit.
- Sélectionnez Paramètres utilisateur, puis faites défiler jusqu’à la section Clés API.
Installez la bibliothèque wandb et connectez-vous
wandb localement et vous connecter :
- Ligne de commande
- Python
- Python notebook
-
Définissez la variable d’environnement
WANDB_API_KEYavec votre clé API. -
Installez la bibliothèque
wandbet connectez-vous.
Ajoutez WandbLogger à votre fichier de configuration spaCy
[training.logger], vous devez renseigner la clé @loggers avec la valeur "spacy.WandbLogger.v3", ainsi qu’un project_name.
Pour en savoir plus sur le fonctionnement des fichiers de configuration d’entraînement de spaCy et sur les autres options que vous pouvez fournir pour personnaliser l’entraînement, consultez la documentation de spaCy.
| Nom | Description |
|---|---|
project_name | str. Le nom du projet W&B. Le projet sera créé automatiquement s’il n’existe pas encore. |
remove_config_values | List[str] . Une liste de valeurs à exclure de la configuration avant son envoi vers W&B. [] par défaut. |
model_log_interval | Optional int. None par défaut. S’il est défini, active la gestion des versions des modèles avec Artifacts. Indiquez le nombre d’étapes à attendre entre chaque enregistrement de point de contrôle du modèle. None par défaut. |
log_dataset_dir | Optional str. Si un chemin est fourni, le jeu de données sera téléversé en tant qu’Artifact au début de l’entraînement. None par défaut. |
entity | Optional str . Si fourni, le run sera créé dans l’entité spécifiée |
run_name | Optional str . Si spécifié, le run sera créé avec le nom indiqué. |
Lancer l’entraînement
WandbLogger à votre configuration d’entraînement spaCy, vous pouvez exécuter spacy train comme d’habitude.
- Ligne de commande
- Python
- Python notebook