이 노트북은 대화형입니다. 로컬에서 실행하거나 아래 링크를 통해 열 수 있습니다:
Weave와 통합: 프로덕션 대시보드
- Weave에서 트레이스, 비용, 피드백 및 기타 메트릭 가져오기
- 사용자 피드백 및 비용 분포에 대한 집계 보기 생성
- 시간 경과에 따른 토큰 사용량과 지연 시간 시각화 생성
streamlit을 설치하고 이 프로덕션 대시보드 스크립트를 실행하여, 자신의 Weave 프로젝트에서 이 대시보드를 직접 사용해 볼 수 있습니다!
1. 설정
2. 구현
2.1 Weave 클라이언트 초기화 및 비용 정의
- 많은 표준 모델에 대해 표준 비용을 미리 포함해 두었지만, 사용자가 직접 커스텀 비용과 커스텀 모델을 손쉽게 추가할 수도 있습니다. 아래에서는 몇 가지 모델에 대해 커스텀 비용을 추가하는 방법과, 나머지 모델에 대해 표준 비용을 사용하는 방법을 보여줍니다.
- 비용은 Weave에서 각 호출에 대해 추적된 토큰을 기반으로 계산됩니다. 많은 LLM 벤더 라이브러리의 경우 토큰 사용량을 자동으로 추적하지만, 어떤 호출에 대해서든 커스텀 토큰 개수를 반환하는 것도 가능합니다. 커스텀 모델에 대해 토큰 개수와 비용 계산을 정의하는 방법은 이 쿡북을 참고하세요: 커스텀 비용 쿡북.
2.2 Weave에서 호출 데이터 가져오기
- 호출별로 데이터 가져오기
- 고수준 API 사용하기
2.2.1 호출 단위로 데이터 가져오기
calls_query_stream API를 사용해 Weave에서 호출 데이터를 가져올 수 있습니다:
calls_query_streamAPI: 이 API를 사용하면 Weave에서 호출 데이터를 가져올 수 있습니다.filter사전: 이 사전에는 호출 데이터를 가져오기 위한 필터 매개변수가 포함되어 있습니다. 자세한 내용은 여기를 참고하세요.expand_columns리스트: 이 리스트에는 호출 데이터에서 확장할 컬럼이 포함되어 있습니다.sort_by리스트: 이 리스트에는 호출 데이터를 정렬하기 위한 매개변수가 포함되어 있습니다.include_costs불리언: 이 불리언은 호출 데이터에 비용 정보를 포함할지 여부를 나타냅니다.include_feedback불리언: 이 불리언은 호출 데이터에 피드백을 포함할지 여부를 나타냅니다.
2.2.2 고수준 API 사용하기
query_costs API를 사용해서 프로젝트에서 사용된 모든 LLM의 비용을 가져올 수 있습니다:
2.4 입력 수집 및 시각화 생성
결론
- 데이터 입력:
- @weave-op() 데코레이터를 사용한 프레임워크에 구애받지 않는 트레이싱과 CSV에서 호출을 가져오는 기능(관련 import 쿠크북 참고)
- 다양한 프로그래밍 프레임워크와 언어에서 Weave로 로깅하기 위한 Service API 엔드포인트(자세한 내용은 여기 참고).
- 데이터 출력: