sweep 명령은 --pause, --resume와 같은 플래그를 사용하여 새 W&B run을 생성하는 스윕의 동작을 제어하며, 기존 run에는 서로 다른 영향을 미칩니다:
--pause: 스윕을 일시 중지하면, 스윕을 다시 재개할 때까지 에이전트는 새로운 run을 생성하지 않습니다. 기존 run은 정상적으로 계속 실행됩니다.--resume: 스윕을 재개하면, 에이전트는 검색 전략에 따라 계속해서 새로운 run을 생성합니다.--stop: 스윕을 중지하면, 에이전트는 새로운 run 생성을 중단합니다. 기존 run은 완료될 때까지 계속됩니다.--cancel: 스윕을 취소하면, 에이전트는 현재 실행 중인 모든 run을 즉시 종료하고 새로운 run 생성을 중단합니다.
스윕 일시 중지
wandb sweep --pause 명령을 사용해 스윕을 일시 중지하세요. 일시 중지할 스윕 ID를 함께 지정합니다.
스윕 다시 시작하기
wandb sweep --resume 명령으로 일시 중지된 스윕을 다시 시작합니다. 스윕은 검색 전략에 따라 다시 새로운 run을 생성하기 시작합니다. 다시 시작하려는 스윕 ID를 지정합니다:
스윕 중지
wandb sweep --stop 명령을 사용하세요:
스윕 취소하기
wandb sweep --cancel 명령을 사용하세요. 취소하려는 스윕 ID를 지정하세요.
스윕과 run 상태 이해하기
주요 차이점
- Sweep status는 새로운 run을 생성할지 여부를 제어합니다 (Running, Paused, Stopped, Cancelled, Finished, Failed, Crashed)
- Run status는 개별 run의 실행 상태를 나타냅니다 (Pending, Running, Finished, Failed, Crashed, Killed)
개별 run 중지하기
모범 사례
- 실행 중인 실험을 잃지 않고 탐색을 일시적으로 중단하려면 cancel 대신
--pause를 사용하세요 - 반복적으로 발생하는 실패를 파악하기 위해 개별 run 상태를 모니터링하세요
- 만족스러운 하이퍼파라미터를 찾았을 때는 정상적으로 종료하기 위해
--stop을 사용하세요 - run이 과도한 리소스를 사용하거나 오류를 발생시키는 등의 비상 상황에서는
--cancel을 사용하세요