TypeScript로 Weave 사용 퀵스타트 가이드
- 언어 모델 입력, 출력 및 트레이스를 로깅하고 디버깅할 수 있습니다
- 언어 모델 활용 사례에 대해 엄밀하고 공정한 평가를 구축할 수 있습니다
- 실험부터 평가, 프로덕션에 이르기까지 LLM 워크플로 전체에서 생성되는 모든 정보를 체계적으로 정리할 수 있습니다
함수 추적
weave.op 래퍼를 추가하세요.
weave.op을 추가하고 함수를 호출한 뒤, W&B 대시보드에서 해당 함수가 프로젝트 내에서 어떻게 추적되고 있는지 확인하세요.
코드는 자동으로 추적됩니다. UI에서 Code 탭을 확인해 보세요!
OpenAI 인테그레이션
- 토큰 사용량
- API 비용
- 요청/응답 쌍
- 모델 설정
OpenAI뿐만 아니라 Weave는 Anthropic, Mistral과 같은 다른 LLM 제공자의 자동 로깅도 지원합니다. 전체 목록은 인테그레이션 문서의 LLM Providers를 참조하세요.
중첩 함수 추적
- 애플리케이션 로직 흐름에 대한 완전한 가시성 확보
- 복잡한 연산 체인의 디버깅 용이
- 성능 최적화 기회 포착
데이터셋 관리
weave.Dataset 클래스를 사용해 데이터셋을 생성하고 관리할 수 있습니다. Weave Models와 유사하게, weave.Dataset은 다음과 같은 작업에 도움이 됩니다:
- 데이터 추적 및 버전 관리
- 테스트 케이스 구성
- 팀 구성원 간 데이터셋 공유
- 체계적인 평가 수행
평가 프레임워크
Evaluation 클래스를 사용해 평가 주도 개발을 지원합니다. Evaluation은 GenAI 애플리케이션을 신뢰할 수 있게 반복적으로 개선하는 데 도움이 됩니다. Evaluation 클래스는 다음 작업을 수행합니다:
Dataset에서Model성능을 평가- 사용자 정의 스코어링 함수 적용
- 상세한 성능 리포트 생성
- 모델 버전 간 비교 가능
main 함수는 모든 데모를 실행합니다.