- 評価メトリクスの経時的なトラッキング
- プログラムシグネチャの変化を確認するための W&B Tables
- MIPROv2 などの DSPy オプティマイザとのインテグレーション
注
wandb==0.21.2 および weave==0.52.5 時点では、W&B と併用すると Weave は自動的に初期化されます。weaveを import してからwandb.init()を呼び出した場合 (スクリプトの場合)wandb.init()を呼び出した後でweaveを import した場合 (notebook/Jupyter の場合)
weave.init(...) を呼び出す必要はありません。インストールと認証
- コマンドライン
- Python
- ノートブック
-
必要なライブラリをインストールします。
-
WANDB_API_KEY環境変数を設定して、ログインします。
プログラム最適化をトラッキングする (実験的)
dspy.Evaluate を使用する DSPy オプティマイザ (MIPROv2 など) では、WandbDSPyCallback を使用して、時間の経過に伴う評価メトリクスをログし、W&B Tables でプログラムシグネチャの変遷をトラッキングします。
run オブジェクトが WandbDSPyCallback に渡されない場合は、グローバルな run オブジェクトが使用されます。

予測をW&B Tablesにログする
予測データにアクセスする
- run の Overview ページにアクセスします。
predictions_0、predictions_1のような名前の Table パネルを探します。- 失敗を分析するには、
is_correctでフィルターします。 - プロジェクトのワークスペースで、run 間の表を比較します。
example: 入力データprediction: モデルの出力is_correct: 評価結果