- Observer et déboguer votre application LLM
- Évaluer les réponses de votre application à l’aide de juges LLM et d’évaluateurs personnalisés
Premiers pas
Démarrage rapide : Suivre les entrées et sorties d’un LLM
Commencez par tracer un appel simple à un LLM et examinez les données dans votre compte W&B.
Commencez à évaluer votre application
Découvrez comment créer un pipeline d’évaluation à l’aide des évaluateurs Weave pour tester et suivre les performances de votre application.
Évaluer une application RAG
Créez et évaluez des applications RAG avec Weave et des juges LLM afin de mesurer la qualité de la récupération.
Installer Weave
- Python
- TypeScript