メインコンテンツへスキップ

`AttributeError: module 'wandb' has no attribute ...` のようなエラーを修正するにはどうすればよいですか?

AttributeError: module ‘wandb’ has no attribute ‘init’ や AttributeError: module ‘wandb’ … のようなエラーが発生した場合

sweep 中の `Cuda out of memory` を解決するにはどうすればよいですか?

sweep 中に Cuda out of memory が発生する場合は、プロセスベースの実行を使用するようにコードをリファクタリングしてください。コードを … として書き直してください

wandb を使ってジョブを停止するにはどうすればよいですか?

W&B で計測しているスクリプトを停止するには、キーボードで Ctrl+D を押します。

wandb の run 初期化タイムアウトエラーを解決するにはどうすればよいですか?

run の初期化タイムアウトエラーを解決するには、次の step に従う: 初期化を再試行する: run の再開を試みます。Che …

wandb がクラッシュした場合、トレーニング run もクラッシュする可能性はありますか?

トレーニング runs への干渉を避けることは非常に重要です。W&B は別プロセスで動作するため、トレーニングは継続されます …

InitStartError: wandb プロセスとの通信エラー

このエラーは、サーバーにデータを同期するプロセスの起動時に、ライブラリで問題が発生していることを示します。Th …

UI では私の run の状態が `crashed` になっていますが、マシン上ではまだ実行中です。データを取り戻すにはどうすればよいですか?

おそらくトレーニング中にマシンとの接続が失われました。wandb sync PATH_TO_RUN (/models/ref/ … を実行してデータを復旧してください

Hydra を W&B と一緒に使用すると、プロセスがハングするのはなぜですか?

Hydra で起動したときにプロセスがハングする場合、これは Hydra と W&B の間のマルチプロセッシングの競合が原因である可能性が高いです …

分散トレーニングでトレーニングがハングするのはなぜですか?

W&B を分散トレーニングと一緒に使用するとトレーニングがハングする一般的な理由は 2 つあります: 1. トレーニング開始時のハング …

ローカルでは正常にトレーニングしているのに、W&B で run が crashed と表示されるのはなぜですか?

これは接続の問題を示しています。サーバーがインターネット接続を失い、W&B へのデータ同期が停止すると、システムは …