Passer au contenu principal
Il s’agit d’un notebook interactif. Vous pouvez l’exécuter localement ou utiliser les liens ci-dessous :

Importer des traces depuis des systèmes tiers

Il arrive qu’il ne soit pas possible d’instrumenter votre code Python ou JavaScript avec l’intégration simple de Weave afin d’obtenir des traces en temps réel de votre application GenAI. Souvent, ces traces sont ensuite disponibles au format csv ou json. Dans ce cookbook, nous explorons l’API Python de bas niveau de Weave pour extraire des données d’un fichier CSV et les importer dans Weave afin d’en tirer des enseignements et de réaliser des évaluations rigoureuses. Le jeu de données d’exemple utilisé dans ce cookbook a la structure suivante :
conversation_id,turn_index,start_time,user_input,ground_truth,answer_text
1234,1,2024-09-04 13:05:39,This is the beginning, ['This was the beginning'], That was the beginning
1235,1,2024-09-04 13:02:11,This is another trace,, That was another trace
1235,2,2024-09-04 13:04:19,This is the next turn,, That was the next turn
1236,1,2024-09-04 13:02:10,This is a 3 turn conversation,, Woah thats a lot of turns
1236,2,2024-09-04 13:02:30,This is the second turn, ['That was definitely the second turn'], You are correct
1236,3,2024-09-04 13:02:53,This is the end,, Well good riddance!

Pour comprendre les choix d’import dans ce cookbook, il faut savoir que les traces Weave ont des relations parent-enfant continues de type 1:N. Cela signifie qu’un parent peut avoir plusieurs enfants, mais qu’il peut lui-même être l’enfant d’un autre parent. Nous utilisons donc conversation_id comme identifiant du parent, et turn_index comme identifiant de l’enfant afin de disposer d’une journalisation complète des conversations. Veillez à modifier les variables selon vos besoins.

Configurer l’environnement

Nous installons et importons tous les paquets nécessaires. Nous définissons WANDB_API_KEY dans notre environnement afin de pouvoir nous connecter facilement avec wandb.login() (cela doit être fourni à colab en tant que secret). Nous définissons le nom du fichier que nous importons dans colab dans name_of_file, puis le projet W&B dans lequel nous voulons enregistrer cela dans name_of_wandb_project. REMARQUE : name_of_wandb_project peut aussi être au format {team_name}/{project_name} pour spécifier une équipe dans laquelle enregistrer les traces. Nous récupérons ensuite un client Weave en appelant weave.init()
%pip install wandb weave pandas datetime --quiet
python
import os

import pandas as pd
import wandb
from google.colab import userdata

import weave

## Écrire le fichier d'exemples sur le disque
with open("/content/import_cookbook_data.csv", "w") as f:
    f.write(
        "conversation_id,turn_index,start_time,user_input,ground_truth,answer_text\n"
    )
    f.write(
        '1234,1,2024-09-04 13:05:39,This is the beginning, ["This was the beginning"], That was the beginning\n'
    )
    f.write(
        "1235,1,2024-09-04 13:02:11,This is another trace,, That was another trace\n"
    )
    f.write(
        "1235,2,2024-09-04 13:04:19,This is the next turn,, That was the next turn\n"
    )
    f.write(
        "1236,1,2024-09-04 13:02:10,This is a 3 turn conversation,, Woah thats a lot of turns\n"
    )
    f.write(
        '1236,2,2024-09-04 13:02:30,This is the second turn, ["That was definitely the second turn"], You are correct\n'
    )
    f.write("1236,3,2024-09-04 13:02:53,This is the end,, Well good riddance!\n")

os.environ["WANDB_API_KEY"] = userdata.get("WANDB_API_KEY")
name_of_file = "/content/import_cookbook_data.csv"
name_of_wandb_project = "import-weave-traces-cookbook"

wandb.login()
python
weave_client = weave.init(name_of_wandb_project)

Chargement des données

Nous chargeons les données dans un dataframe Pandas et veillons à les trier par conversation_id et turn_index afin que les éléments parents et enfants soient correctement ordonnés. On obtient ainsi un dataframe Pandas à deux colonnes, avec nos tours de conversation sous forme de tableau dans conversation_data.
## Charger et mettre en forme les données
df = pd.read_csv(name_of_file)

sorted_df = df.sort_values(["conversation_id", "turn_index"])

# Fonction pour créer un tableau de dictionnaires pour chaque conversation
def create_conversation_dict_array(group):
    return group.drop("conversation_id", axis=1).to_dict("records")

# Regrouper le dataframe par conversation_id et appliquer l'agrégation
result_df = (
    sorted_df.groupby("conversation_id")
    .apply(create_conversation_dict_array)
    .reset_index()
)
result_df.columns = ["conversation_id", "conversation_data"]

# Afficher le résultat de l'agrégation
result_df.head()

Journaliser les traces dans Weave

Nous itérons maintenant sur notre DataFrame pandas :
  • Nous créons un appel parent pour chaque conversation_id
  • Nous parcourons le tableau des tours pour créer des appels enfants, triés selon leur turn_index
Concepts importants de l’API Python de bas niveau :
  • Un appel Weave est équivalent à une trace Weave ; cet appel peut avoir un parent ou des enfants qui lui sont associés
  • Un appel Weave peut également avoir d’autres éléments qui lui sont associés : Feedback, Metadata, etc. Ici, nous ne lui associons que des entrées et des sorties, mais vous pouvez vouloir ajouter ces éléments lors de l’importation si les données les fournissent.
  • Un appel Weave est created puis finished, car ces événements sont conçus pour être suivis en temps réel. Comme il s’agit ici d’une importation a posteriori, nous créons et terminons l’appel une fois que nos objets sont définis et liés entre eux.
  • La valeur op d’un appel correspond à la façon dont Weave catégorise des appels de même nature. Dans cet exemple, tous les appels parents sont de type Conversation, et tous les appels enfants sont de type Turn. Vous pouvez modifier cela comme bon vous semble.
  • Un appel peut avoir des inputs et un output. Les inputs sont définis lors de la création et l’output est défini lorsque l’appel est terminé.
# Enregistrer les traces dans Weave

# Itérer sur nos conversations agrégées
for _, row in result_df.iterrows():
    # Définir le parent de notre conversation,
    # nous créons maintenant un "call" avec le weave_client défini précédemment
    parent_call = weave_client.create_call(
        # La valeur Op enregistrera ceci comme un Op Weave, ce qui nous permettra de récupérer ces éléments en groupe facilement à l'avenir
        op="Conversation",
        # Nous définissons les entrées de notre conversation de haut niveau comme l'ensemble des tours qui la composent
        inputs={
            "conversation_data": row["conversation_data"][:-1]
            if len(row["conversation_data"]) > 1
            else row["conversation_data"]
        },
        # Notre parent Conversation n'a pas de parent supplémentaire
        parent=None,
        # Le nom sous lequel cette conversation spécifique apparaîtra dans l'interface utilisateur
        display_name=f"conversation-{row['conversation_id']}",
    )

    # Nous définissons la sortie du parent comme la dernière trace de la conversation
    parent_output = row["conversation_data"][len(row["conversation_data"]) - 1]

    # Nous itérons maintenant sur tous les tours de la conversation pour le parent
    # et les enregistrons comme enfants de la conversation
    for item in row["conversation_data"]:
        item_id = f"{row['conversation_id']}-{item['turn_index']}"

        # Nous créons ici un nouvel appel pour le catégoriser sous la conversation
        call = weave_client.create_call(
            # Nous qualifions une trace de conversation unique comme un "Turn"
            op="Turn",
            # Nous fournissons toutes les entrées du tour, y compris le 'ground_truth' RAG
            inputs={
                "turn_index": item["turn_index"],
                "start_time": item["start_time"],
                "user_input": item["user_input"],
                "ground_truth": item["ground_truth"],
            },
            # Nous définissons ceci comme un enfant du parent que nous avons défini
            parent=parent_call,
            # Nous lui attribuons un nom pour l'identifier dans Weave
            display_name=item_id,
        )

        # Nous définissons la sortie de l'appel comme la réponse
        output = {
            "answer_text": item["answer_text"],
        }

        # Ces traces ayant déjà eu lieu, nous terminons l'appel du tour unique
        weave_client.finish_call(call=call, output=output)
    # Maintenant que nous avons enregistré tous ses enfants, nous terminons également l'appel parent
    weave_client.finish_call(call=parent_call, output=parent_output)

Résultat : les traces sont enregistrées dans Weave

Traces :
image.png
Opérations :
image.png

Bonus : exportez vos traces pour réaliser des évaluations rigoureuses !

Une fois nos traces dans Weave et après avoir compris à quoi ressemblent les conversations, vous pouvez ensuite les exporter vers un autre processus pour exécuter des évaluations Weave.
image.png
Pour ce faire, nous récupérons toutes les conversations depuis W&B via notre API simple de requête et créons un jeu de données à partir de celles-ci.
## Cette cellule ne s'exécute pas par défaut, commentez la ligne ci-dessous pour exécuter ce script
%%script false --no-raise-error
## Récupérer toutes les traces de conversation pour l'évaluation et préparer le jeu de données

# Nous créons un filtre de requête qui récupère tous nos objets Conversation
# La référence indiquée ci-dessous est spécifique à votre projet ; vous pouvez l'obtenir en
# accédant aux opérations de votre projet dans l'interface utilisateur, en cliquant sur l'objet "Conversations",
# puis sur l'onglet "Use" dans le panneau latéral.
weave_ref_for_conversation_op = "weave://wandb-smle/import-weave-traces-cookbook/op/Conversation:tzUhDyzVm5bqQsuqh5RT4axEXSosyLIYZn9zbRyenaw"
filter = weave.trace_server.trace_server_interface.CallsFilter(
    op_names=[weave_ref_for_conversation_op],
  )

# Nous exécutons la requête
conversation_traces = weave_client.get_calls(filter=filter)

rows = []

# Nous parcourons nos traces de conversation et construisons les lignes du jeu de données à partir de celles-ci
for single_conv in conversation_traces:
  # Dans cet exemple, nous ne nous intéressons qu'aux conversations ayant utilisé notre pipeline
  # RAG ; nous filtrons donc ce type de conversations
  is_rag = False
  for single_trace in single_conv.inputs['conversation_data']:
    if single_trace['ground_truth'] is not None:
      is_rag = True
      break
  if single_conv.output['ground_truth'] is not None:
      is_rag = True

  # Une fois qu'une conversation est identifiée comme ayant utilisé RAG, nous l'ajoutons à notre jeu de données
  if is_rag:
    inputs = []
    ground_truths = []
    answers = []

    # Nous parcourons chaque tour de la conversation
    for turn in single_conv.inputs['conversation_data']:
      inputs.append(turn.get('user_input', ''))
      ground_truths.append(turn.get('ground_truth', ''))
      answers.append(turn.get('answer_text', ''))
    ## Gérer le cas où les conversations ne comportent qu'un seul tour
    if len(single_conv.inputs) != 1 or single_conv.inputs['conversation_data'][0].get('turn_index') != single_conv.output.get('turn_index'):
      inputs.append(single_conv.output.get('user_input', ''))
      ground_truths.append(single_conv.output.get('ground_truth', ''))
      answers.append(single_conv.output.get('answer_text', ''))

    data = {
        'question': inputs,
        'contexts': ground_truths,
        'answer': answers
    }

    rows.append(data)

# Une fois les lignes du jeu de données créées, nous créons l'objet Dataset et
# le publions dans Weave pour pouvoir le récupérer ultérieurement
dset = weave.Dataset(name = "conv_traces_for_eval", rows=rows)
weave.publish(dset)

Résultat

image.png
Pour en savoir plus sur les évaluations, consultez notre Démarrage rapide pour apprendre à utiliser le jeu de données que vous venez de créer afin d’évaluer votre application RAG !