- Pinned runs: 최대 6개의 Run 을 고정(Pin)하여 Workspace 와 Run 리스트 상단에 항상 표시되도록 유지합니다. baseline run 이 있는 경우 baseline run 이 암묵적으로 고정되므로 최대 5개의 Run 만 추가로 고정할 수 있습니다.
- Baseline run: 비교를 위한 기준점으로 baseline run 을 지정합니다. baseline run 은 Workspace 와 Run 리스트 상단에 항상 표시됩니다. runs 테이블에서 요약 메트릭 델타는 각 run 이 baseline 과 어떻게 비교되는지를 보여줍니다. 라인 플롯에서 baseline 은 비교를 돕기 위해 시각적으로 구별되는 스타일로 나타납니다.
- 새로운 실험을 프로덕션 모델과 비교할 때.
- 실험 과정에서 여러 후보 모델을 추적할 때.
- 새로운 Run 이 기존의 최상위 결과를 개선하는지 평가할 때.
Run 고정 (Pin runs)
- 워크스페이스로 이동합니다.
- run 선택기 또는 Runs 테이블에서 고정하려는 run을 찾습니다.
...작업 메뉴를 클릭한 다음 Pin run을 선택합니다.

Baseline run 관리하기

Baseline run 설정하기
- Workspace 로 이동합니다.
- Run 선택기 또는 Run 테이블에서 baseline 으로 사용할 Run 을 찾습니다.
- 액션
...메뉴를 클릭한 다음 Set as baseline을 선택합니다.

Baseline run 변경하기
- Workspace 로 이동합니다.
- Run 선택기 또는 Run 테이블에서 새로운 baseline 으로 사용할 Run 을 찾습니다.
- 액션
...메뉴를 클릭한 다음 Replace baseline을 선택합니다.
Baseline 지정 해제하기
- Workspace 로 이동합니다.
- Run 선택기 또는 Run 테이블에서 현재 baseline 으로 설정된 Run 을 찾습니다.
- 액션
...메뉴를 클릭한 다음 Remove baseline을 선택합니다.
Baseline과 Run 비교하기
- 플롯의 특정 부분에 마우스를 가져가면 baseline run 과 고정된 Run 을 포함하여 표시된 모든 Run 의 값을 툴팁으로 보여줍니다.

- baseline run 의 범례 레이블에 마우스를 가져가면 해당 선이 강조되어 표시됩니다. 굵은 점선으로 나타나며, 다른 Run 의 선들은 채도가 낮아집니다.

- 다른 Run 의 범례 레이블에 마우스를 가져가면 해당 Run 의 선이 강조되어 표시되며, 굵은 점선으로 표시된 baseline 과 비교할 수 있습니다. 다른 Run 의 선들은 채도가 낮아집니다.

요약 메트릭 델타
- 다른 run이 기준선보다 더 잘 수행(방향성 기준으로 더 좋음)하는 경우 delta는 어두운 빨간색 텍스트와 옅은 빨간색 배경으로 표시됩니다.
- 다른 run이 기준선보다 성능이 떨어지는(방향성 기준으로 더 나쁨) 경우 delta는 어두운 청록색 텍스트와 옅은 청록색 배경으로 표시됩니다.
- runs 테이블에서 해당 메트릭의 열 헤더 위에 마우스를 올려놓습니다.
- 나타나는
...동작 메뉴를 클릭합니다. - Metric directionality 를 Higher values are best 또는 Lower values are best 로 설정합니다.
nanochat-train과 run nanochat-train-base, nanochat-train-mid가 어떻게 비교되는지를 보여 줍니다. TOTAL_TRAINING_TIME, TRAIN/DT, TRAIN/GRAD_NORM에 대해 delta 메트릭이 표시되어 있습니다.

워크스페이스에서 요약 메트릭 변화량 숨기기
- 워크스페이스에서 Settings를 클릭합니다.
- 나타나는 드로어에서 Runs를 클릭합니다.
- Baseline 탭에서 Show value deltas in the runs table 토글 스위치를 전환합니다.
- 워크스페이스 설정 드로어를 닫습니다.
예시 워크플로우
-
일련의 Run 을 통해 하이퍼파라미터 튜닝 시나리오를 시뮬레이션하는 다음 예제 코드를 실행합니다. 꺾쇠괄호 (
<>)로 둘러싸인 자리 표시자를 실제 값으로 바꿉니다.이 코드를 실행한 후, Workspace 에는 세 개의 Run 이 생깁니다. -
baseline-config를 baseline run 으로 설정합니다. -
baseline-config를 고정(Pin)하여 계속 표시되도록 합니다. - baseline 과 실험 Run 들을 비교합니다.
- Runs 테이블에서 각 run 의 값 옆에 있는 요약 메트릭 변화(delta)를 검토하여 baseline 과 비교합니다.
- 라인 플롯에서 하나 이상의 run 성능을 항상 표시되는 baseline 과 비교합니다.
- 추가 조사가 필요한 유망한 실험들을 고정합니다. 이 예시에서 50 에포크 후에
lr-experiment-0.003이 가장 높은 정확도 (~0.64)와 가장 낮은 손실 (~0.86)을 기록합니다.
제한 사항
- 그룹화 (Grouping): Run 선택기 또는 Run 테이블에서 Run을 볼 때, Run 이 특정 컬럼으로 그룹화되어 있으면 고정된 Run 과 baseline run 이 다른 Run 과 시각적으로 구별되지 않습니다.
- Reports: W&B Report의 Run 세트 내에서 고정된 Run 과 baseline run 은 다른 Run 과 시각적으로 구별되지 않습니다.
- Workspace 뷰 전용: 단일 Run 의 Workspace 를 볼 때는 baseline 이 나타나지 않습니다.
- 라인 플롯 전용: baseline 비교는 라인 플롯에서만 가능하며, 바 차트나 미디어 패널 등 다른 패널에서는 아직 사용할 수 없습니다.