Il s’agit d’un notebook interactif. Vous pouvez l’exécuter localement ou utiliser les liens ci-dessous :
Intégration avec Weave : tableau de bord de production
- La récupération des traces, coûts, retours utilisateurs et autres métriques depuis Weave
- La création de vues agrégées pour les retours utilisateurs et la répartition des coûts
- La création de visualisations de l’utilisation des tokens et de la latence au fil du temps
1. Configuration
2. Implémentation
2.1 Initialisation du client Weave et définition des coûts
- Nous avons inclus les coûts standard pour de nombreux modèles, mais vous pouvez aussi facilement ajouter vos propres coûts et modèles personnalisés. La suite montre comment ajouter des coûts personnalisés pour quelques modèles et utiliser les coûts standard pour les autres.
- Les coûts sont calculés en fonction des tokens suivis pour chaque appel dans Weave. Pour de nombreuses bibliothèques de fournisseurs de LLM, nous suivons automatiquement l’utilisation des tokens, mais vous pouvez aussi renvoyer un nombre de tokens personnalisé pour n’importe quel appel. Voir ce cookbook pour savoir comment définir le nombre de tokens et le calcul du coût d’un modèle personnalisé : cookbook sur les coûts personnalisés.
2.2 Récupération des données d’appels de Weave
- Récupérer les données appel par appel
- Utiliser des API de haut niveau
2.2.1 Récupération des données appel par appel
calls_query_stream pour récupérer les données des appels depuis Weave :
- API
calls_query_stream: cette API permet de récupérer les données des appels depuis Weave. - Dictionnaire
filter: ce dictionnaire contient les paramètres de filtre pour récupérer les données des appels - voir ici pour plus de détails. - Liste
expand_columns: cette liste contient les colonnes à développer dans les données des appels. - Liste
sort_by: cette liste contient les paramètres de tri des données des appels. - Booléen
include_costs: ce booléen indique s’il faut inclure les coûts dans les données des appels. - Booléen
include_feedback: ce booléen indique s’il faut inclure les retours dans les données des appels.
2.2.2 Utilisation d’API de haut niveau
query_costs pour récupérer les coûts de tous les LLM utilisés dans le projet :
2.4 Collecte des données d’entrée et génération des visualisations
Conclusion
- Entrée des données :
- Tracing indépendant du framework avec le décorateur @weave-op(), avec la possibilité d’importer des appels depuis un fichier CSV (voir le guide d’import associé)
- Des API endpoint de service pour envoyer des journaux vers Weave depuis différents frameworks et langages de programmation ; voir ici pour plus de détails.
- Sortie des données :