- 음성 기반 에이전트
- 고급 리서치 어시스턴트
- 온프레미스 모델
- 콘텐츠 마케팅 분석 에이전트
왜 Serverless RL인가?
- 더 낮은 트레이닝 비용: 여러 사용자가 인프라를 공유해 멀티플렉싱하고, 각 작업마다 별도의 설정 과정을 생략하며, 트레이닝을 수행하지 않을 때 GPU 비용을 0까지 줄임으로써, Serverless RL은 트레이닝 비용을 크게 절감합니다.
- 더 짧은 트레이닝 시간: 추론 요청을 여러 GPU에 분산하고, 필요할 때마다 즉시 트레이닝 인프라를 프로비저닝함으로써, Serverless RL은 트레이닝 작업을 가속하고 더 빠르게 실험을 반복할 수 있게 해줍니다.
- 자동 배포: Serverless RL은 트레이닝한 모든 체크포인트를 자동으로 배포하므로, 호스팅 인프라를 수동으로 구축할 필요가 없습니다. 트레이닝된 모델은 로컬, 스테이징, 프로덕션 환경에서 즉시 사용하고 테스트할 수 있습니다.
Serverless RL이 W&B 서비스를 사용하는 방법
- Inference: 모델을 실행하기 위해
- Models: LoRA 어댑터의 트레이닝 동안 성능 메트릭을 추적하기 위해
- Artifacts: LoRA 어댑터를 저장하고 버전 관리하기 위해
- Weave (optional): 트레이닝 루프의 각 단계에서 모델 응답을 관측하기 위해