이 튜토리얼에서는 기존 W&B 프로젝트에서 스윕 잡을 생성하는 방법을 설명합니다. Fashion MNIST 데이터셋을 사용하여 이미지 분류를 수행하도록 PyTorch 합성곱 신경망(convolutional neural network)을 학습합니다. 필요한 코드와 데이터셋은 W&B examples repository (PyTorch CNN Fashion)에 포함되어 있습니다.
이 W&B 대시보드에서 결과를 살펴보세요.
먼저 기준선을 만듭니다. W&B examples GitHub 리포지토리에서 PyTorch MNIST 데이터셋 예제 모델을 다운로드합니다. 그런 다음 모델을 트레이닝합니다. 트레이닝 스크립트는 examples/pytorch/pytorch-cnn-fashion 디렉터리에 있습니다.
- 이 리포지토리를 클론합니다.
git clone https://github.com/wandb/examples.git
- 이 예제 디렉터리로 이동합니다.
cd examples/pytorch/pytorch-cnn-fashion
- run을 수동으로 실행합니다.
python train.py
원한다면, 이 예제가 W&B App UI 대시보드에 어떻게 표시되는지 살펴보세요.
예제 프로젝트 페이지 보기 →
프로젝트 페이지의 프로젝트 사이드바에서 Sweep 탭을 열고 Create Sweep을 선택합니다.
자동으로 생성된 설정은 완료된 run을 기반으로 스윕할 값들을 추론합니다. 시도할 하이퍼파라미터 범위를 지정하도록 설정을 수정하세요. 스윕을 실행하면, 호스팅된 W&B 스윕 서버에서 새로운 프로세스가 시작됩니다. 이 중앙 집중식 서비스는 트레이닝 작업을 실행하는 머신인 에이전트를 조율합니다.
다음으로, 로컬에서 에이전트를 실행합니다. 작업을 분산해서 스윕 작업을 더 빠르게 완료하려면 서로 다른 머신에서 최대 20개의 에이전트를 병렬로 실행할 수 있습니다. 에이전트는 다음에 시도할 파라미터 집합을 출력합니다.
이제 스윕이 실행 중입니다. 아래 이미지는 예제 스윕 작업이 실행되는 동안 대시보드가 어떻게 보이는지 보여줍니다. 예제 프로젝트 페이지 보기 →
이전에 로그해 둔 기존 runs를 사용해서 새 스윕을 시작합니다.
- 프로젝트 테이블을 엽니다.
- 테이블 왼쪽의 체크박스를 사용해서 사용할 runs를 선택합니다.
- 드롭다운을 클릭해 새 스윕을 생성합니다.
이제 스윕이 서버 측에서 설정됩니다. 한 개 이상의 에이전트를 실행하기만 하면 runs가 실행되기 시작합니다.
새 스윕을 베이지안 스윕으로 시작하면, 선택한 runs는 가우시안 프로세스의 시드로도 사용됩니다.