これはインタラクティブなノートブックです。ローカルで実行するか、以下のリンクから利用できます:
preprocess_model_input を用いた評価で HuggingFace Datasets を使用する
注意: これは一時的な回避策です
このガイドでは、HuggingFace Datasets を Weave の評価で利用するための回避策を紹介します。
現在、このプロセスを簡素化する、よりシームレスなインテグレーションの開発を進めています。
この方法でも動作しますが、今後、外部データセットをより扱いやすくするための改善と更新が行われる予定です。
セットアップとインポート
HuggingFace データセットを読み込んで準備する
- HuggingFace データセットを読み込みます。
- データセットの各行を参照するためのインデックスマッピングを作成します。
- このインデックス方式により、元のデータセットへの参照を維持できます。
Note:
インデックス内では、各行が一意の識別子を持つように、hf_idとともにhf_hub_nameをエンコードします。 この一意のダイジェスト値は、評価中に特定のデータセットエントリを追跡および参照するために使用されます。
処理関数と評価関数を定義する
処理パイプライン
preprocess_example: インデックス参照を、評価に必要な実データへと変換しますhf_eval: モデル出力のスコアリング方法を定義しますfunction_to_evaluate: 実際に評価される関数/モデルです
評価を作成して実行する
- hf_index の各インデックスに対して:
preprocess_exampleが HF データセットから対応するデータを取得します。- 前処理されたデータを
function_to_evaluateに渡します。 - 出力を
hf_evalでスコアリングします。 - 結果を Weave でトラッキングします。