가격 정책
추론
트레이닝
모델 저장소
제한 사항
-
Inference 동시 처리 한도: 기본적으로 Serverless RL은 현재 사용자당 최대 2000개, 프로젝트당 최대 6000개의 동시 요청을 지원합니다. 한도(rate limit)를 초과하면 Inference API는
429 Concurrency limit reached for requests응답을 반환합니다. 이 오류를 피하려면 트레이닝 작업 또는 프로덕션 워크로드에서 한 번에 보내는 동시 요청 수를 줄이십시오. 더 높은 한도가 필요하다면 support@wandb.com으로 요청할 수 있습니다. - 지리적 제한: Serverless RL은 지원되는 지역에서만 사용할 수 있습니다. 자세한 내용은 Terms of Service를 참조하십시오.