Skip to main content
서버 오류는 W&B Inference 서비스에 일시적인 문제가 있음을 의미합니다.

오류 유형

500 - 내부 서버 오류

메시지: “서버가 요청을 처리하는 중 오류가 발생했습니다” 이 오류는 서버 측에서 일시적으로 발생하는 내부 오류입니다.

503 - 서비스 과부하

메시지: “엔진이 현재 과부하 상태이므로, 나중에 다시 사용해 보세요” 서비스에 트래픽이 많이 몰리고 있습니다.

서버 오류 처리 방법

  1. 재시도하기 전에 기다리기
    • 500 오류: 30~60초 기다리세요
    • 503 오류: 60~120초 기다리세요
  2. 지수 백오프 사용
    import time
    import openai
    
    def call_with_retry(client, messages, model, max_retries=5):
        for attempt in range(max_retries):
            try:
                return client.chat.completions.create(
                    model=model,
                    messages=messages
                )
            except Exception as e:
                if "500" in str(e) or "503" in str(e):
                    if attempt < max_retries - 1:
                        wait_time = min(60, (2 ** attempt))
                        time.sleep(wait_time)
                    else:
                        raise
                else:
                    raise
    
  3. 적절한 타임아웃 설정
    • HTTP 클라이언트의 타임아웃 값을 늘리세요
    • 더 안정적으로 처리하려면 비동기 오퍼레이션을 고려하세요

지원팀에 문의해야 하는 경우

다음과 같은 경우 지원팀에 문의하세요:
  • 오류가 10분 이상 지속되는 경우
  • 특정 시간대에 실패가 반복되는 경우
  • 오류 메시지에 추가 세부 정보가 포함된 경우
다음 정보를 제공하세요:
  • 오류 메시지 및 코드
  • 오류가 발생한 시간
  • 코드 스니펫(API 키 제거)
  • W&B entity 및 프로젝트 이름

Inference