- 新しい評価 run が追加されたとき
- 結果が保存済みのフィルタ条件と一致したとき
Leaderboard で Evaluation 結果を可視化する
- wandb.ai に移動します。
- Weave のサイドバーメニューで Evaluations をクリックします。
- Evaluation テーブルにフィルタを適用し、比較したいモデル、データセット、または run にデータを絞り込みます。
- evaluation table toolbar で Visualize をクリックします。
Weave は、テーブルで現在フィルタされているデータだけを使用して、自動的に Leaderboard パネルを作成します。 - Leaderboard パネルのヘッダーで Configure をクリックして、Edit Leaderboard パネルを開きます。
Edit Leaderboard パネルでは、モデル、データセット、スコアラー、メトリクスの表示方法を細かく制御できます。

Leaderboard 要素の表示設定とカスタム名の設定

-
表示の有効化/無効化
Leaderboard に表示するモデル、データセット、スコアラー、メトリクスを、チェックボックスのオン/オフで選択します。 -
モデル、データセット、スコアラーの名前変更
表示に適したわかりやすい名前を付けます(たとえば、model run の名前をGPT-4に変更したり、データセットをJokesV1に変更したりします)。 名前を変更した項目は:- Leaderboard 上で即座に更新されます
- クリック可能なままなので、サイドパネルで元の参照を開くことができます
- Leaderboard ビューが使用されているすべての場所に自動的に反映されます
Leaderboard のメトリクス動作とカラーリングを設定する
- 値が大きいほうが良い
- 値が小さいほうが良い
- 緑は より良い 値をハイライトします。
- 赤は より悪い 値をハイライトします。
- 「値が大きいほうが良い」と「値が小さいほうが良い」を切り替えると、色は自動的に反転します。
Leaderboard ビューを保存して再利用する
- 選択したモデル、データセット、スコアラー、メトリクス
- 表示ラベルの変更内容
- メトリクスの方向設定(値が大きい/小さいどちらが良いか)
- 適用されたフィルタ
保存済みビューを切り替える
- デフォルト ビューに戻り、データセット全体を表示する。
- 保存済みビューを再度開き、すべてのカスタマイズを即座に復元する。