W&B Weave

W&B Weave est une plateforme d’observabilité et d’évaluation qui vous aide à suivre, évaluer et améliorer votre application LLM. Avec Weave, vous pouvez :

Observer et déboguer votre application LLM
Évaluer les réponses de votre application à l’aide de juges LLM et d’évaluateurs personnalisés

Premiers pas

Les documents suivants vous guident dans les bases de l’utilisation de la suite d’outils de Weave.

Démarrage rapide : Suivre les entrées et sorties d’un LLM

Commencez par tracer un appel simple à un LLM et examinez les données dans votre compte W&B.

Commencez à évaluer votre application

Découvrez comment créer un pipeline d’évaluation à l’aide des évaluateurs Weave pour tester et suivre les performances de votre application.

Évaluer une application RAG

Créez et évaluez des applications RAG avec Weave et des juges LLM afin de mesurer la qualité de la récupération.

Installer Weave

W&B Weave propose des bibliothèques Python et TypeScript. Pour installer la bibliothèque Weave, exécutez la commande suivante :

Python
TypeScript

pip install weave

pnpm install weave

Pour commencer à utiliser la bibliothèque Weave, créez un compte Weights & Biases (W&B) ainsi qu’une clé API dans Paramètres utilisateur. La clé API vous permet de vous authentifier à votre compte W&B et de commencer à y envoyer des données.

Démarrage rapide : Suivre les entrées et sorties d’un LLM

⌘I

Premiers pas

Guides

Guides pratiques

Référence

Détails et assistance

Premiers pas

Démarrage rapide : Suivre les entrées et sorties d’un LLM

Commencez à évaluer votre application

Évaluer une application RAG

Installer Weave

Premiers pas

Guides

Guides pratiques

Référence

Détails et assistance

​Premiers pas

Démarrage rapide : Suivre les entrées et sorties d’un LLM

Commencez à évaluer votre application

Évaluer une application RAG

​Installer Weave

Premiers pas

Installer Weave