メインコンテンツへスキップ
W&B CLI を使用して、スイープを一時停止、再開、キャンセルします。CLI の sweep コマンドは --pause--resume などのフラグを使用して、スイープが新しい W&B run を作成できるかどうかを制御します。既存の run への影響はフラグごとに異なります:
  • --pause: スイープを一時停止すると、スイープを再開するまでエージェントは新しい run を作成しません。既存の run は通常どおり実行を続けます。
  • --resume: スイープを再開すると、エージェントは探索戦略に従って新しい run の作成を再開します。
  • --stop: スイープを停止すると、エージェントは新しい run の作成を停止します。既存の run は完了まで実行されます。
  • --cancel: スイープをキャンセルすると、エージェントは現在実行中のすべての run を直ちに強制終了し、新しい run の作成も停止します。
以下の手順に従って、スイープを一時停止、再開、キャンセルします。いずれの場合も、スイープを初期化したときに生成されたスイープ ID を指定します。

スイープを一時停止する

スイープを一時停止すると、新しい run の作成が一時的に停止します。すでに実行中の run は、完了するまで実行を続けます。wandb sweep --pause コマンドを使用してスイープを一時停止します。一時停止したいスイープの ID を指定してください。
wandb sweep --pause entity/project/sweep_ID

スイープを再開する

一時停止したスイープは、wandb sweep --resume コマンドで再開できます。スイープは、そのサーチ戦略に従って新しい run を再び作成し始めます。再開するスイープの ID を指定します。
wandb sweep --resume entity/project/sweep_ID

スイープを停止する

新しい run の作成を止めつつ、現在実行中の run はそのまま正常に完了させるには、スイープを終了します。wandb sweep --stop コマンドを使用します。
wandb sweep --stop entity/project/sweep_ID
W&B は、プロジェクトを削除しても、実行中の Sweeps やエージェントを停止しません。

スイープをキャンセルする

スイープをキャンセルすると、実行中のすべての run を即座に強制終了し、新しい run の作成も停止します。これは、既存の run を強制終了できる唯一のスイープコマンドです。スイープをキャンセルするには、wandb sweep --cancel コマンドを使用し、キャンセルするスイープの ID を指定してください。
wandb sweep --cancel entity/project/sweep_ID
CLI コマンドオプションの一覧については、wandb sweep CLI リファレンスガイドを参照してください。
プロジェクトを削除しても、W&B はアクティブなスイープやエージェントを停止しません。

スイープとrunのステータスを理解する

スイープは複数のrunを調整して、ハイパーパラメータの組み合わせを探索します。スイープステータスとrunステータスがどのように関係するかを理解することは、ハイパーパラメータ最適化を効果的に管理するうえで重要です。

主な違い

  • スイープのステータス は新しい run を作成するかどうかを制御します(Running、Paused、Stopped、Cancelled、Finished、Failed、Crashed)
  • run のステータス は個々の run の実行状態を示します(Pending、Running、Finished、Failed、Crashed、Killed)

個々のrunを停止する

スイープ内でrunを停止すると、スイープエージェントは自動的にスイープ内の次のrunを開始します。これにより、スイープ全体の進行状況を中断することなく、パフォーマンスの低い設定をスキップできます。

ベストプラクティス

  • 実行中の実験を失うことなく一時的に探索を停止したい場合は、cancel ではなく --pause を使用する
  • 個々の run のステータスを監視して、共通する失敗パターンを特定する
  • 満足のいくハイパーパラメータが見つかったら、--stop を使用して安全に終了させる
  • run が過剰なリソースを消費している、またはエラーを出している緊急時にのみ --cancel を使用する