1. W&B にログインする
2. run を初期化する
wandb.init() を使用して run を初期化します。これにより、データの同期とログ記録を行うバックグラウンドプロセスが起動されます。プロジェクト名とジョブタイプを指定します。
3. アーティファクトオブジェクトを作成する
wandb.Artifact() を使ってアーティファクトオブジェクトを作成します。name パラメータにはアーティファクトの名前を、type パラメータにはファイルタイプの説明をそれぞれ指定します。
たとえば、次のコードスニペットでは、‘bicycle-dataset’ という名前と ‘dataset’ というラベルを持つアーティファクトを作成しています。
4. データセットをアーティファクトに追加する
dataset.h5 という名前のデータセットをアーティファクトに追加します。
dataset.h5 を、アーティファクトに追加したいファイルへのパスに置き換えてください。
5. データセットをログに記録する
wandb.Run.log_artifact() メソッドを使用して、アーティファクトのバージョンを保存し、そのアーティファクトをrun の出力として指定します。
'latest' エイリアス が作成されます。アーティファクトのエイリアスとバージョンの詳細については、それぞれ カスタムエイリアスを作成する と 新しいアーティファクトバージョンを作成する を参照してください。
ここまでを踏まえると、現時点でのスクリプトは次のようになります。
6. アーティファクトをダウンロードして使用する
- まず、新しい run オブジェクトを
wandb.init()で初期化します。 - 次に、run オブジェクトの
wandb.Run.use_artifact()メソッドを使って、どのアーティファクトを使用するかを W&B に指定します。このメソッドはアーティファクトオブジェクトを返します。 - 最後に、アーティファクトの
wandb.Artifact.download()メソッドを使って、アーティファクトの内容をダウンロードします。
wandb.Api)を使用して、run の外で W&B に既に保存されているデータをエクスポート(または更新)できます。詳細は、「外部ファイルをトラッキングする」を参照してください。