- 새로운 evaluation run이 추가될 때
- 그리고 결과가 저장된 필터와 일치할 때
Leaderboard에서 Evaluation 결과 시각화하기
- wandb.ai로 이동합니다.
- Weave 사이드바 메뉴에서 Evaluations를 클릭합니다.
- 비교하려는 모델, 데이터셋, run만 남도록 Evaluation 테이블에 필터를 적용합니다.
- evaluation table toolbar에서 Visualize를 클릭합니다.
Weave는 테이블에서 현재 필터링된 데이터만 사용하여 Leaderboard 패널을 자동으로 생성합니다. - Leaderboard 패널 헤더에서 Configure를 클릭하여 Edit Leaderboard 패널을 엽니다.
Edit Leaderboard 패널에서는 모델, 데이터셋, 스코어러, 메트릭의 표시 방식을 세밀하게 제어할 수 있습니다.

Leaderboard 요소의 표시 여부와 사용자 지정 이름 설정

-
표시 활성화/비활성화
Leaderboard에 표시할 모델, 데이터셋, 스코어러, 메트릭을 표시 여부를 체크/해제하여 선택합니다. -
모델, 데이터셋, 스코어러 이름 변경
보기 편한 이름을 지정합니다(예: 모델 run의 이름을GPT-4로 바꾸거나 데이터셋을JokesV1으로 변경). 이름을 변경한 항목은:- Leaderboard에 즉시 반영되며
- 여전히 클릭 가능해서 사이드 패널에서 해당 원본 객체를 열 수 있고
- Leaderboard 뷰가 사용되는 모든 위치에 자동으로 반영됩니다
Leaderboard 메트릭 동작 및 색상 설정
- 값이 클수록 좋음, 또는
- 값이 작을수록 좋음
- 초록색은 더 나은 값을 강조 표시합니다.
- 빨간색은 더 나쁜 값을 강조 표시합니다.
- “값이 클수록 좋음”과 “값이 작을수록 좋음”을 전환하면 색상이 자동으로 반전됩니다.
리더보드 뷰 저장 및 재사용
- 선택한 모델, 데이터셋, 스코어러, 메트릭
- 변경된 표시 레이블 이름
- 메트릭 방향 설정(값이 클수록/작을수록 더 좋은지)
- 적용된 필터
저장된 뷰 전환하기
- 전체 데이터셋을 보려면 기본 뷰로 돌아갑니다.
- 저장된 뷰를 다시 열어 모든 사용자 지정 내용을 즉시 복원합니다.