Skip to main content
「Concurrency limit reached for requests」というメッセージを伴う 429 エラーは、W&B Inference API に同時リクエストを送りすぎていることを示しています。

これが発生する理由

W&B Inference は、公平な利用とサービスの安定性を確保するため、同時実行制限を強制しています。お使いのアカウントからの同時リクエスト数が許可された制限値を超えると、追加のリクエストは 429 ステータスコードで拒否されます。

できること

  1. 同時リクエストを減らす
    • アプリケーションにリクエストのキューイングまたはスロットリングを実装する
    • 失敗したリクエストを再試行する際は、指数バックオフを使用する
  2. 制限を引き上げる
    • プランの同時実行制限を確認し、必要に応じてアップグレードする
詳細は、使用状況と制限を参照してください。
クォータとレート制限