1. Connectez-vous à W&B
2. Initialiser un run
wandb.init() pour initialiser un run. Cela lance un processus en arrière-plan pour synchroniser et journaliser les données. Indiquez un nom de projet et un type de job :
3. Créer un objet artifact
wandb.Artifact(). Indiquez un nom pour l’artifact et une description du type de fichier pour les paramètres name et type, respectivement.
Par exemple, l’extrait de code suivant montre comment créer un artifact appelé ‘bicycle-dataset’ avec le libellé ‘dataset’ :
4. Ajoutez le jeu de données à l’artifact
dataset.h5, enregistré localement sur votre machine :
dataset.h5 dans l’extrait de code précédent par le chemin d’accès du fichier que vous souhaitez ajouter à l’artifact.
5. Consigner le jeu de données
wandb.Run.log_artifact() des objets run de W&B pour enregistrer la version de votre artifact et déclarer cet artifact comme sortie du run.
'latest' est créé par défaut lorsque vous journalisez un artifact. Pour en savoir plus sur les alias et les versions d’artifact, voir Créer un alias personnalisé et Créer de nouvelles versions d’artifact, respectivement.
Au final, votre script devrait ressembler à ceci :
6. Télécharger et utiliser l’artifact
- Commencez par initialiser un nouvel objet run avec
wandb.init(). - Ensuite, utilisez la méthode
wandb.Run.use_artifact()de l’objet run pour indiquer à W&B quel artifact utiliser. Cette méthode renvoie un objet artifact. - Enfin, utilisez la méthode
wandb.Artifact.download()de l’artifact pour télécharger son contenu.
wandb.Api) pour exporter des données (ou les mettre à jour) déjà enregistrées dans W&B en dehors d’un Run. Voir Track external files pour plus d’informations.