sweep de la CLI utilise des indicateurs tels que --pause et --resume pour contrôler la capacité du balayage à créer de nouveaux runs W&B, avec des effets différents sur les runs existants :
--pause: lorsque vous mettez un balayage en pause, l’agent ne crée plus de nouveau run tant que vous ne reprenez pas le balayage. Les runs existants continuent de s’exécuter normalement.--resume: lorsque vous reprenez un balayage, l’agent recommence à créer de nouveaux runs selon la stratégie de recherche.--stop: lorsque vous arrêtez un balayage, l’agent cesse de créer de nouveaux runs. Les runs existants continuent jusqu’à leur terme.--cancel: lorsque vous annulez un balayage, l’agent arrête immédiatement tous les runs en cours d’exécution et cesse de créer de nouveaux runs.
Mettre en pause un balayage
wandb sweep --pause pour mettre un balayage en pause. Indiquez l’ID du balayage que vous souhaitez mettre en pause.
Reprendre un balayage
wandb sweep --resume. Le balayage recommencera alors à créer de nouveaux runs selon sa stratégie de recherche. Saisissez l’ID du balayage que vous souhaitez reprendre :
Arrêter un balayage
wandb sweep --stop :
Annuler un balayage
wandb sweep --cancel pour annuler un balayage. Indiquez l’ID du balayage que vous souhaitez annuler. Pour en savoir plus sur les signaux et les runs de balayage, voir Gestion des signaux et runs de balayage.
Comprendre les statuts des balayages et des runs
Différences clés
- Le statut du balayage détermine si de nouveaux runs sont créés (Running, Paused, Stopped, Cancelled, Finished, Failed, Crashed)
- Le statut du run indique l’état d’exécution de chaque run (Pending, Running, Finished, Failed, Crashed, Killed)
Arrêter un run spécifique
Bonnes pratiques
- Utilisez
--pauseplutôt que annuler lorsque vous souhaitez interrompre temporairement l’exploration sans perdre les expériences en cours - Surveillez le statut de chaque run pour identifier les échecs systématiques
- Utilisez
--stoppour un arrêt propre lorsque vous avez trouvé des hyperparamètres satisfaisants - Réservez
--cancelaux situations d’urgence, lorsque les runs consomment trop de ressources ou produisent des erreurs