- Serverless RL: 멀티턴 에이전트형 작업을 수행할 때 속도를 높이고 비용을 줄이면서 모델의 신뢰성을 향상합니다. RL은 모델이 출력에 대한 피드백을 통해 동작을 개선하도록 학습하는 트레이닝 기법입니다.
- Serverless SFT: 지식 증류, 출력 스타일 및 형식 학습, 또는 RL 전 워밍업을 위해 선별된 데이터셋을 사용해 모델을 파인튜닝합니다.
- 유연한 파인튜닝 프레임워크인 ART
- 범용 검증기인 RULER
- CoreWeave Cloud에서 제공되는 완전 관리형 백엔드