Passer au contenu principal
POST
/
v2
/
{entity}
/
{project}
/
eval_results
/
query
Requête sur les résultats d’évaluation
curl --request POST \
  --url https://api.example.com/v2/{entity}/{project}/eval_results/query \
  --header 'Authorization: Basic <encoded-value>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "evaluation_call_ids": [
    "<string>"
  ],
  "evaluation_run_ids": [
    "<string>"
  ],
  "require_intersection": false,
  "include_raw_data_rows": false,
  "resolve_row_refs": false,
  "include_rows": true,
  "include_summary": false,
  "summary_require_intersection": true,
  "limit": 123,
  "offset": 0
}
'
{
  "rows": [
    {
      "row_digest": "<string>",
      "raw_data_row": null,
      "evaluations": [
        {
          "evaluation_call_id": "<string>",
          "trials": [
            {
              "predict_and_score_call_id": "<string>",
              "predict_call_id": "<string>",
              "model_output": null,
              "scores": {},
              "model_latency_seconds": 123,
              "total_tokens": 123,
              "scorer_call_ids": {}
            }
          ]
        }
      ]
    }
  ],
  "total_rows": 123,
  "summary": {
    "row_count": 0,
    "evaluations": [
      {
        "evaluation_call_id": "<string>",
        "trial_count": 0,
        "scorer_stats": [
          {
            "scorer_key": "<string>",
            "path": "<string>",
            "value_type": "binary",
            "trial_count": 0,
            "numeric_count": 0,
            "numeric_mean": 123,
            "pass_true_count": 0,
            "pass_known_count": 0,
            "pass_rate": 123,
            "pass_signal_coverage": 123
          }
        ],
        "evaluation_ref": "<string>",
        "model_ref": "<string>",
        "display_name": "<string>",
        "trace_id": "<string>",
        "started_at": "<string>"
      }
    ]
  },
  "warnings": [
    "<string>"
  ]
}

Autorisations

Authorization
string
header
requis

Basic authentication header of the form Basic <encoded-value>, where <encoded-value> is the base64-encoded string username:password.

Paramètres de chemin

entity
string
requis
project
string
requis

Corps

application/json
evaluation_call_ids
string[] | null

ID des appels racine d'évaluation à inclure.

evaluation_run_ids
string[] | null

Alias des ID d'appel d'évaluation provenant de l'API Evaluation Runs.

require_intersection
boolean
défaut:false

Lorsque cette valeur est true, incluez uniquement les lignes présentes dans toutes les évaluations demandées.

include_raw_data_rows
boolean
défaut:false

Lorsque cette valeur est true, renseignez raw_data_row sur chaque ligne de résultat. Les lignes inline sont renvoyées sous la forme de leur valeur dict ; les lignes référencées par un jeu de données sont renvoyées sous forme de chaîne de référence, sauf si resolve_row_refs est également true.

resolve_row_refs
boolean
défaut:false

Lorsque cette valeur est true (nécessite include_raw_data_rows=True), résolvez les chaînes de référence des lignes du jeu de données en données de ligne réelles via une recherche dans un tableau. Lorsque cette valeur est false, les références de ligne du jeu de données sont renvoyées telles quelles.

include_rows
boolean
défaut:true

Lorsque cette valeur est true, incluez les données groupées de ligne/essai dans rows et calculez total_rows pour la vue demandée au niveau ligne.

include_summary
boolean
défaut:false

Lorsque cette valeur est true, incluez dans summary les données de synthèse agrégées du scorer et de l'évaluation.

summary_require_intersection
boolean | null

Comportement d'intersection facultatif pour la section de synthèse. Lorsqu'elle vaut null, la valeur de require_intersection est utilisée.

limit
integer | null

Taille de page facultative au niveau ligne, appliquée après le regroupement et l'intersection.

offset
integer
défaut:0

Décalage de page facultatif au niveau ligne, appliqué après le regroupement et l'intersection.

Réponse

Réponse réussie

rows
EvalResultsRow · object[]
requis
total_rows
integer
requis
summary
EvalResultsSummaryRes · object
warnings
string[]

Avertissements non fatals (par ex. échec de la résolution des références de ligne du jeu de données).