Il s’agit d’un notebook interactif. Vous pouvez l’exécuter en local ou utiliser les liens ci-dessous :
🔑 Prérequis
- Installez le SDK W&B Weave et connectez-vous avec votre clé API.
- Installez l’OpenAI SDK et connectez-vous avec votre clé API.
- Initialisez votre projet W&B.
🐝 Lancez votre première évaluation
Model et Evaluation de Weave. Commencez par définir un modèle Weave en héritant de weave.Model, en indiquant le nom du modèle et le format du prompt, puis en assurant le suivi d’une méthode predict avec @weave.op. La méthode predict envoie un prompt à OpenAI et convertit la réponse en une sortie structurée à l’aide d’un schéma Pydantic (FruitExtract). Créez ensuite un petit jeu de données d’évaluation composé de phrases en entrée et de cibles attendues. Définissez ensuite une fonction de score personnalisée (également suivie avec @weave.op) qui compare la sortie du modèle au libellé cible. Enfin, encapsulez le tout dans un weave.Evaluation, en spécifiant votre jeu de données et vos évaluateurs, puis appelez evaluate() pour exécuter le pipeline d’évaluation de manière asynchrone.
🚀 Vous cherchez d’autres exemples ?
- Découvrez comment créer un pipeline d’évaluation de bout en bout.
- Découvrez comment évaluer une application RAG en la développant.