Il s’agit d’un notebook interactif. Vous pouvez l’exécuter en local ou utiliser les liens ci-dessous :
Utiliser HuggingFace jeux de données pour les évaluations avec preprocess_model_input
Remarque : il s’agit d’une solution de contournement temporaire
Ce guide présente une solution de contournement pour utiliser HuggingFace jeux de données dans les évaluations Weave.
Nous travaillons activement à des intégrations plus fluides qui simplifieront ce processus. Bien que cette approche fonctionne, attendez-vous à des améliorations et à des mises à jour prochainement, qui rendront l’utilisation de jeux de données externes plus simple.
Configuration et importations
Charger et préparer le jeu de données HuggingFace
- Nous chargeons un jeu de données HuggingFace.
- Nous créons un mappage d’index pour référencer les lignes du jeu de dataset.
- Cette approche par index nous permet de conserver des références au jeu de données original.
Remarque :
Dans l’index, nous encodonshf_hub_nameainsi quehf_idafin de garantir que chaque ligne dispose d’un identifiant unique. Cette valeur de condensé unique est utilisée pour assurer le suivi et référencer des entrées spécifiques du jeu de données lors des évaluations.
Définir les fonctions de traitement et d’évaluation
Pipeline de traitement
preprocess_example: transforme la référence de l’index en données effectives nécessaires à l’évaluationhf_eval: définit comment calculer le score des sorties du modèlefunction_to_evaluate: la fonction/le modèle effectivement évalué
Créer et exécuter l’évaluation
- Pour chaque index de hf_index :
preprocess_examplerécupère les données correspondantes du jeu de données HF.- Les données prétraitées sont transmises à
function_to_evaluate. - La sortie est évaluée à l’aide de
hf_eval. - Les résultats sont suivis dans Weave.