Passer au contenu principal
Utilisez la W&B CLI pour mettre en pause, reprendre et annuler un balayage. La commande sweep de la CLI utilise des indicateurs tels que --pause et --resume pour contrôler la capacité du balayage à créer de nouveaux runs W&B, avec des effets différents sur les runs existants :
  • --pause : lorsque vous mettez un balayage en pause, l’agent ne crée plus de nouveau run tant que vous ne reprenez pas le balayage. Les runs existants continuent de s’exécuter normalement.
  • --resume : lorsque vous reprenez un balayage, l’agent recommence à créer de nouveaux runs selon la stratégie de recherche.
  • --stop : lorsque vous arrêtez un balayage, l’agent cesse de créer de nouveaux runs. Les runs existants continuent jusqu’à leur terme.
  • --cancel : lorsque vous annulez un balayage, l’agent arrête immédiatement tous les runs en cours d’exécution et cesse de créer de nouveaux runs.
Suivez les instructions ci-dessous pour mettre en pause, reprendre et annuler un balayage. Dans chaque cas, indiquez l’ID du balayage généré lorsque vous avez initialisé un balayage.

Mettre en pause un balayage

Mettez un balayage en pause afin qu’il cesse temporairement de créer de nouveaux runs. Les Runs déjà en cours d’exécution se poursuivront jusqu’à leur achèvement. Utilisez la commande wandb sweep --pause pour mettre un balayage en pause. Indiquez l’ID du balayage que vous souhaitez mettre en pause.
wandb sweep --pause entity/project/sweep_ID

Reprendre un balayage

Reprenez un balayage en pause avec la commande wandb sweep --resume. Le balayage recommencera alors à créer de nouveaux runs selon sa stratégie de recherche. Saisissez l’ID du balayage que vous souhaitez reprendre :
wandb sweep --resume entity/project/sweep_ID

Arrêter un balayage

Mettez fin à un balayage pour arrêter la création de nouveaux runs tout en laissant les runs en cours se terminer normalement. Utilisez la commande wandb sweep --stop :
wandb sweep --stop entity/project/sweep_ID
W&B n’arrête pas les balayages ni les agents en cours lorsque vous supprimez un projet.

Annuler un balayage

Annulez un balayage pour arrêter immédiatement tous les runs en cours et empêcher la création de nouveaux runs. Il s’agit de la seule commande de balayage qui interrompt de force les runs existants. Les runs sont arrêtés brutalement ; les processus en cours n’ont aucune possibilité d’exécuter des gestionnaires de signaux définis par l’utilisateur. Utilisez la commande wandb sweep --cancel pour annuler un balayage. Indiquez l’ID du balayage que vous souhaitez annuler. Pour en savoir plus sur les signaux et les runs de balayage, voir Gestion des signaux et runs de balayage.
wandb sweep --cancel entity/project/sweep_ID
Pour la liste complète des options de la commande CLI, voir le guide de référence CLI wandb sweep.
W&B ne met pas fin aux balayages ni aux agents actifs lorsque vous supprimez un projet.

Comprendre les statuts des balayages et des runs

Un balayage orchestre plusieurs runs afin d’explorer des combinaisons d’hyperparamètres. Comprendre l’interaction entre le statut du balayage et celui du run est essentiel pour gérer efficacement l’optimisation de vos hyperparamètres.

Différences clés

  • Le statut du balayage détermine si de nouveaux runs sont créés (Running, Paused, Stopped, Cancelled, Finished, Failed, Crashed)
  • Le statut du run indique l’état d’exécution de chaque run (Pending, Running, Finished, Failed, Crashed, Killed)

Arrêter un run spécifique

Lorsque vous arrêtez un run dans un balayage, l’agent de balayage lance automatiquement le run suivant. Cela vous permet d’ignorer les configurations peu performantes sans interrompre la progression globale du balayage.

Bonnes pratiques

  • Utilisez --pause plutôt que annuler lorsque vous souhaitez interrompre temporairement l’exploration sans perdre les expériences en cours
  • Surveillez le statut de chaque run pour identifier les échecs systématiques
  • Utilisez --stop pour un arrêt propre lorsque vous avez trouvé des hyperparamètres satisfaisants
  • Réservez --cancel aux situations d’urgence, lorsque les runs consomment trop de ressources ou produisent des erreurs