시작하기
weave.init(project=...)를 호출하면 됩니다. project 인수를 사용해 team-name/project-name 형식으로 특정 W&B Team 이름으로 로그를 남기거나, project-name만 지정해 기본 팀/엔티티에 로그를 남길 수 있습니다.
호출 메타데이터 추적
weave.attributes 컨텍스트 매니저를 사용할 수 있습니다. 이 컨텍스트 매니저를 사용하면 파이프라인 run 또는 평가 배치와 같은 특정 코드 블록에 대해 사용자 지정 메타데이터를 설정할 수 있습니다.
트레이스
- 파이프라인 실행 단계
- Judge 유닛의 평가
- 레이어 변환 작업
- 풀링 연산
- 사용자 정의 유닛 및 변환
파이프라인 트레이싱 예시
- 주요 Pipeline 실행
- Layer 내 각 JudgeUnit 평가
- MeanPoolUnit의 집계 단계
- 각 연산의 타이밍 정보
설정
weave.init()을 호출하면 Verdict 파이프라인에 대한 트레이싱이 자동으로 활성화됩니다. 이 인테그레이션은 Pipeline.__init__ 메서드를 패치하여, 모든 트레이스 데이터를 Weave로 전달하는 VerdictTracer를 주입하는 방식으로 동작합니다.
추가 설정은 필요하지 않습니다. Weave는 자동으로 다음을 수행합니다:
- 모든 파이프라인 연산을 캡처
- 실행 시간을 추적
- 입력 및 출력을 로깅
- 트레이스 계층 구조를 유지
- 동시 파이프라인 실행을 처리
커스텀 트레이서와 Weave
VerdictTracer를 함께 사용할 수 있습니다.
모델 및 평가
weave.Model을 사용하면 프롬프트, 파이프라인 설정, 평가 파라미터와 같은 실험 세부 정보를 기록하고 정리할 수 있어 서로 다른 반복 실험을 더 쉽게 비교할 수 있습니다.
다음 예시는 Verdict 파이프라인을 WeaveModel로 래핑하는 방법을 보여줍니다.
평가
weave.Evaluation 클래스를 사용하면 Verdict 파이프라인이 특정 작업이나 데이터셋에서 얼마나 잘 수행되는지 기록할 수 있습니다: