Passer au contenu principal
Lorsque vous travaillez avec les évaluations Weave, vous pouvez visualiser et personnaliser les résultats de vos expériences sous forme de Leaderboards. Les vues de Leaderboard enregistrées sont dynamiques :
  • À mesure que de nouveaux runs d’évaluation sont ajoutés
  • Et que les résultats correspondent aux filtres enregistrés
Le Leaderboard se met automatiquement à jour pour les inclure, sans reconfiguration manuelle. Cela vous permet d’utiliser des vues comme des leaderboards persistants qui évoluent avec vos expériences.

Visualiser les résultats d’Évaluation dans un Leaderboard

Lorsque votre projet contient des données d’Évaluation Weave, vous pouvez utiliser le tableau d’évaluation pour créer rapidement une vue Leaderboard Weave à partir d’un sous-ensemble filtré de résultats. Pour créer un Leaderboard Weave :
  1. Accédez à wandb.ai.
  2. Dans le menu latéral de Weave, cliquez sur Évaluations.
  3. Appliquez des filtres au tableau d’évaluation pour limiter les données aux Models, Datasets ou runs que vous souhaitez comparer.
  4. Dans la barre d’outils du tableau d’évaluation, cliquez sur Visualize. Weave crée automatiquement un panneau Leaderboard en utilisant uniquement les données actuellement filtrées dans le tableau.
  5. Dans l’en-tête du panneau Leaderboard, cliquez sur Configure pour ouvrir le panneau Edit Leaderboard. Le panneau Edit Leaderboard vous permet de contrôler précisément l’affichage des Models, Datasets, évaluateurs et métriques.
L’exemple suivant montre comment un tableau d’évaluation filtré est visualisé sous forme de Leaderboard et où configurer le Leaderboard obtenu.
Page Évaluations montrant le tableau d’évaluation avec des filtres appliqués, le bouton Visualize dans la barre d’outils du tableau, et le panneau Leaderboard obtenu à droite avec le bouton Configure dans l’en-tête du panneau.

Configurer les éléments du Leaderboard : visibilité et noms personnalisés

L’exemple ci-dessous montre le panneau Edit Leaderboard avec quatre onglets de configuration : Models, Datasets, Scorers et Metrics.
Page Evaluations montrant le panneau Edit Leaderboard ouvert à droite, avec les onglets Models, Datasets, Scorers et Metrics pour configurer le Leaderboard.
Dans le panneau Edit Leaderboard, vous pouvez :
  • Activer/désactiver l’affichage Sélectionnez les Models, Datasets, évaluateurs et métriques à afficher dans le Leaderboard en les cochant ou en les décochant.
  • Renommer les Models, les Datasets et les évaluateurs Attribuez-leur des noms d’affichage plus explicites (par exemple, renommer le run d’un modèle en GPT-4 ou un jeu de données en JokesV1). Éléments renommés :
    • Sont mis à jour immédiatement dans le Leaderboard
    • Restent cliquables, ce qui vous permet toujours d’ouvrir la référence sous-jacente dans le panneau latéral
    • Se répercutent automatiquement partout où la vue Leaderboard est utilisée
Vous pouvez ainsi comparer plus facilement les expériences à l’aide de noms parlants, sans modifier les objets sous-jacents.

Configurer le comportement des métriques et le code couleur du Leaderboard

Dans le panneau Edit Leaderboard, pour chaque métrique, vous pouvez préciser si :
  • Les valeurs les plus élevées sont les meilleures, ou
  • Les valeurs les plus faibles sont les meilleures
Ce paramètre affecte directement le code couleur du Leaderboard :
  • Le vert met en évidence la meilleure valeur.
  • Le rouge met en évidence la moins bonne valeur.
  • Les couleurs s’inversent automatiquement lorsque vous passez de « plus élevé = mieux » à « plus faible = mieux ».
Cela garantit que les repères visuels restent pertinents pour différents types de métriques (par exemple, la précision par rapport à la latence ou au taux d’erreur).

Enregistrer et réutiliser des vues de Leaderboard

Dans le panneau Edit Leaderboard, vous pouvez enregistrer votre Leaderboard personnalisé sous forme de vue réutilisable en cliquant sur Save. La vue de Leaderboard enregistrée comprend :
  • Les Models, Datasets, évaluateurs et métriques sélectionnés
  • Les libellés d’affichage renommés
  • Les paramètres de direction des métriques (une valeur plus élevée ou plus faible est préférable)
  • Les filtres appliqués

Passer d’une vue enregistrée à l’autre

Cliquez sur l’icône de menu (☰) à côté du titre de la page Évaluations pour ouvrir les vues enregistrées. Vous pouvez :
  • Revenir à la vue par défaut pour afficher le jeu de données complet.
  • Rouvrir une vue enregistrée pour rétablir instantanément toutes les personnalisations.
Lorsque vous rouvrez une vue enregistrée, tous les renommages et les paramètres de métrique sont conservés.