wandb.init() を実行していないプロセスから wandb の method を呼び出さないようにプログラムを構成してください。
マルチプロセスのトレーニングは、次の方法で管理できます。
- すべてのプロセスで
wandb.initを呼び出し、group キーワード引数を使用して共有グループを作成します。各プロセスはそれぞれ独自の wandb run を持ち、UI ではそれらのトレーニングプロセスがグループ化されて表示されます。 - 1 つのプロセスでのみ
wandb.initを呼び出し、ログするデータを multiprocessing queues 経由で渡します。
これらの方法の詳細な説明については、Torch DDP を使ったコード例を含む Distributed Training Guide を参照してください。
Experiments