메인 콘텐츠로 건너뛰기
W&B Skills는 코딩 에이전트가 W&B를 효과적으로 사용할 수 있도록 알려주는 재사용 가능한 지침 세트입니다. 에이전트에 W&B API와 모범 사례를 일일이 안내하는 대신 Skills를 설치하면, 에이전트가 실험 추적, Tracing, 평가, 모니터링을 스스로 수행할 수 있습니다. Skills는 다음을 포함한 여러 주요 코딩 에이전트에서 작동합니다.
  • Claude Code
  • Codex
  • Cursor
  • GitHub Copilot
  • Gemini CLI
지원되는 에이전트의 전체 목록은 W&B Skills CLI documentation을 참조하세요.

W&B Skills 기능

Skills는 W&B Models SDK (training runs, 메트릭, artifacts, sweeps)와 Weave SDK (트레이스, 평가, scorers)를 모두 포괄합니다. 헬퍼 라이브러리, 레퍼런스 문서, 데이터 분석 패턴도 포함됩니다.
워크플로기능
모델 트레이닝
  • 트레이닝 및 파인튜닝 중에 메트릭과 리치 미디어를 기록합니다.
  • 실험를 추적하고 비교합니다.
  • run과 결과(예: loss 곡선, accuracy 점수)를 분석합니다.
  • 하이퍼파라미터를 튜닝합니다.
에이전트 구축
  • 에이전트 기반 AI 애플리케이션을 트레이스합니다.
  • 트레이스를 분석하고 실패 모드를 분류합니다.
  • 레이블된 데이터셋으로 모델과 에이전트를 평가합니다.
  • 프로덕션 모니터링을 위해 온라인 평가를 실행합니다.

사전 요구 사항

Skills를 사용하려면 다음이 필요합니다.
  • Node.js (npx 명령어용)
  • W&B API 키. wandb.ai/authorize에서 생성한 후 환경 변수로 설정합니다:
    export WANDB_API_KEY=<your-api-key>
    
  • (선택) W&B 프로젝트 이름을 WANDB_PROJECT 환경 변수로 설정합니다. 이렇게 하면 매번 따로 지정하지 않아도 에이전트가 올바른 W&B 프로젝트를 대상으로 사용할 수 있습니다.

W&B Skills 설치

W&B Skills를 전역으로 설치하려면 --global 플래그를 사용해 다음 명령어를 실행하세요:
npx skills add wandb/skills --skill '*' --yes --global
특정 프로젝트에 Skills를 설치하려면 해당 프로젝트 디렉터리에서 다음 명령어를 실행하세요:
npx skills add wandb/skills --skill '*' --yes
--agent 플래그를 사용해 특정 에이전트용 Skills도 설치할 수 있습니다:
npx skills add wandb/skills --agent claude-code --skill '*' --yes --global
--agent--skill 옵션 목록은 skills CLI 문서를 참조하세요.

W&B Skills 사용하기

설치가 완료되면 에이전트에게 프로젝트와 관련된 W&B 작업을 수행하도록 요청할 수 있습니다. 다음 예시 프롬프트는 에이전트가 W&B Skills로 수행할 수 있는 작업의 일부를 보여줍니다.
  • “내 PyTorch 모델의 트레이닝 메트릭을 W&B에 기록해 줘.”
  • “최근 10개의 run에 대한 loss 곡선을 분석하고 성능이 가장 좋은 설정을 파악해 줘.”
  • “내 LangChain 에이전트를 트레이스하고 결과를 Weave에 기록해 줘.”
  • “테스트 데이터셋을 사용해 내 에이전트를 평가하고 결과를 요약해 줘.”
  • “가장 최근 평가에서 실패 유형을 찾아 분류해 줘.”
  • “run A와 run B의 설정을 비교하고 차이를 보여줘.”

사용 팁

Skills는 광범위한 개방형 질문보다 구체적인 쿼리를 사용할 때 더 잘 작동합니다. 다음 표에는 권장하는 예시 프롬프트와 지나치게 모호한 프롬프트가 나와 있습니다.
권장비권장
”최근 5개 run의 최종 검증 loss는 무엇인가요?""내 모델 상태가 어떤가요?"
"최근 10개 트레이스의 token 사용량을 요약해 주세요.""내 트레이스를 모두 보여 주세요."
"run A와 run B의 설정을 비교해 주세요.""가장 좋은 run은 무엇인가요?"
"어떤 eval의 F1 score가 가장 높았나요?""내 평가는 어떻게 되고 있나요?”