これはインタラクティブなノートブックです。ローカルで実行するか、以下のリンクから開いてください:
Weave との統合: 本番環境ダッシュボード
- Weave からトレース、コスト、フィードバック、その他のメトリクスを取得する
- ユーザーフィードバックとコスト分布の集約ビューを作成する
- トークン使用量とレイテンシの時間推移の可視化を作成する
1. セットアップ
2. 実装
2.1 Weave クライアントの初期化とコストの定義
- 多くの標準モデルについては標準コストをあらかじめ用意していますが、独自のカスタムコストやカスタムモデルも簡単に追加できます。以下では、いくつかのモデルに対してカスタムコストを追加し、それ以外については標準コストを利用する方法を示します。
- コストは、Weave 内で各呼び出しごとに記録されたトークン数に基づいて計算されます。多くの LLM ベンダーのライブラリについてはトークン使用量を自動的に追跡しますが、任意の呼び出しに対してカスタムのトークン数を返すことも可能です。カスタムモデルに対してトークン数とコスト計算を定義する方法については、custom cost cookbook を参照してください。
2.2 Weave から Call データを取得する
- Call ごとにデータを取得する
- 高水準 API を使用する
2.2.1 呼び出しごとにデータを取得する
calls_query_stream API を使用して、Weave から calls データを取得できます。
calls_query_streamAPI: Weave から calls データを取得するための API です。filter辞書: calls データを取得するためのフィルタパラメータを含む辞書です。詳しくはこちらを参照してください。expand_columnsリスト: calls データ内で展開するカラムを含むリストです。sort_byリスト: calls データのソートパラメータを含むリストです。include_costsブール値: calls データにコスト情報を含めるかどうかを示すブール値です。include_feedbackブール値: calls データにフィードバックを含めるかどうかを示すブール値です。
2.2.2 高レベル API の使用
query_costs API を使用して、プロジェクト内で使用されたすべての LLM のコストを取得できます。
2.4 入力の収集と可視化の生成
まとめ
- データ入力:
- @weave-op() デコレータを用いたフレームワーク非依存のトレース機能と、CSV からの呼び出しインポート機能(関連する import cookbook を参照)
- さまざまなプログラミングフレームワークと言語から Weave にログを送信するための Service API エンドポイント。詳細はこちらを参照してください。
- データ出力: