概要
- 手動での trace スコアリング: SME に、正確性、品質、スタイルといった観点からモデルの出力を評価してもらいます。
- 障害解析: モデルが破綻するポイントを理解するために、失敗モード (幻覚、応答拒否、ループ) にアノテーションを付与します。
- ドメインエキスパートレビュー: 医療、法務、安全性などのエキスパートが、タスクに特化したインターフェースでコンテンツをレビューできるようにします。
- データセット作成: アノテーション済みの trace を評価用またはトレーニング用のデータセットに変換します。
エンドツーエンドのワークフロー
- annotation field を定義する。
- annotation queue を作成する。
- queue に trace を読み込んでレビュー対象にする。
- ドメインの専門家がレビューを実施している間、進捗をモニタリングする。
- 完了した annotation をフィルタリングしてエクスポートする。
アノテーションフィールドを定義する
- 正確さや許容可否などの Boolean 判定。
- 品質や信頼度などの数値または整数値。
- 失敗モードやインテントなどのカテゴリラベル。
- 定性的フィードバックのための自由記述テキスト。
- wandb.ai にアクセスし、プロジェクトを選択します。
- Weave プロジェクトのサイドバーで Annotate をクリックします。Annotate が表示されない場合は、メニュー内の More の下にネストされている場合があります。
- タブバーで Fields タブをクリックします。
- Fields テーブルのツールバーで New Field をクリックします。
- Create annotation field モーダルダイアログで、次を設定します:
- Type: Boolean、Integer、Number、String、またはカテゴリ型の選択肢。
- Name: アノテーターに表示されるフィールド名。
- Description (任意): アノテーターに表示される、このフィールドを評価するための詳細。
- Create annotation field をクリックしてフィールドを保存します。

アノテーションキューを作成する
- アノテーションフィールドのセット
- アノテーターへのタスク指示を提供するガイドライン
- レビュー待ちの trace アイテムのコレクション
- Weave プロジェクトのサイドバーで Annotate をクリックします。
- タブバーで Queues タブをクリックします。
- Queues テーブルのツールバーで Create Queue をクリックします。
- Create Annotation Queue モーダルダイアログで、次の項目を設定します。
- Queue name: アノテーターが作業を行う際に選択するキュー名です。
- Guidelines (任意): アノテーター向けの追加の指示。
- Next をクリックします。
- Manage fields をクリックし、このレビュー作業に含める Annotation Fields を選択します。Project に対して既存のすべての Annotation Fields が選択可能です。
- キューに含めるすべての Fields を選択したら、Create Queue をクリックしてキューを保存します。

キューに trace を追加する
- Weave プロジェクトのサイドバーで Traces をクリックします。
- Traces テーブルのツールバーで、必要に応じて trace をフィルタします (hallucination スコア、failure mode、特定の ops など) 。
- テーブルで、アノテーションしたい trace を選択します。
- テーブルのアクションバーで Add to queue をクリックし、選択した行をアノテーションキューに追加します。

- Add to annotation queue モーダルダイアログで、次を設定します:
- Queue Name: 一覧から、これらの trace を追加する既存キューの名前を選択します。
- Select trace data to display: アノテーターが結果を評価するときに表示する Weave trace データ要素を選択します。
- Inputs: アノテーション中に表示する trace 入力フィールドを選択します。
- Outputs: アノテーション中に表示する trace 出力フィールドを選択します。
- Add [Count] traces to annotation queue をクリックして、これらの trace をアノテーションキューのレビュー対象として割り当てます。
レビュー進捗を確認する
- Weave プロジェクトのサイドバーで Annotate をクリックします。
- タブバーで Queues タブをクリックします。
- Annotation Queues テーブルで、キュー項目を開くために対象キューの名前をクリックします。
- Queue のヘッダーバーでリンクボタンをクリックして、このキューへの直接リンクをコピーします。ブラウザのアドレスバーから URL をコピーすることもできます。

- Not started: キューに項目はあるが、提出されたアノテーションがない状態。
- In progress: 少なくとも 1 件の項目がレビューされた状態。
- Completed: すべての項目がレビューされた状態。
アノテーションのフィルタリングとエクスポート
- キューの割り当て状況やアノテーションの完了状況で trace をフィルタリングする。
- フィルタリングしたビューを保存して再利用する。
- 評価用またはトレーニング用のワークフロー向けに、アノテーション済み trace をデータセットにエクスポートする。
アノテーション済みの trace のフィルタリング
- Weave プロジェクトのサイドバーで Traces をクリックします。
- Traces テーブルのツールバーで Filter をクリックします。
- フィルター行に 3 つの値を追加します:
- Column には “Queue” と入力し、Enter を押します。
- 2 つ目のリストで Text: “is” を選択します。
- Select a queue では、アノテーションキューの名前を選択します。
- 完了したキューアイテムのみをフィルタリングするには、+ Add Filter をクリックします:
- Column には “feedback” と入力します。ダイアログに Annotations が表示され、キューに含まれる Annotation Field 名が一覧表示されます。そのキューから必要な Field を選択します。
- 2 つ目のリストで Other: “is not empty” を選択します。

- フィルター行は自動的に適用されます。フィルター入力を閉じるには、ページ内の別の場所をクリックします。
- (オプション) クイックアクセスのためにビューとして保存します。Traces テーブルのヘッダーで Save View をクリックします。
注釈付き trace をデータセットにエクスポートする
アノテーション済み trace をデータセットに追加する
- Weave プロジェクトのサイドバーで Traces をクリックします。
- Traces テーブルで、エクスポートしたい trace を選択します。
- テーブルのツールバーで Add to dataset をクリックします。画面の指示に従って追加を完了します。
プログラムからアノテーションにアクセスする
- Project: W&B プロジェクト名 (
projectまたはteam/project形式) 。W&B team (たとえば “team/project”) を指定しない場合は、デフォルトの team が使用されます。 - Queue ID: アノテーション queue の一意の識別子。
- Annotation Queues テーブルで、アイテムを表示したい queue の名前を選択します。
- ページ URL の末尾から ID をコピーします。