spacy train と併用して、spaCy モデル のトレーニング メトリクス を追跡し、モデル とデータセット を保存およびバージョン管理できるようになりました。しかも、設定ファイルに数行追加するだけで利用できます。
サインアップして API キーを作成する
より手早く行うには、User Settings に直接アクセスしてAPIキーを作成してください。新しく作成したAPIキーはすぐにコピーし、パスワードマネージャーなどの安全な場所に保存してください。
- 画面右上のユーザープロフィールアイコンをクリックします。
- User Settings を選択し、API Keys セクションまでスクロールします。
wandb ライブラリをインストールしてログインする
wandb ライブラリをインストールし、ログインするには、次の手順を実行します。
- Command Line
- Python
- Python notebook
-
WANDB_API_KEY環境変数 を自分の API キー に設定します。 -
wandbライブラリをインストールしてログインします。
spaCy の config ファイルに WandbLogger を追加する
[training.logger] 配下でキー @loggers に値 "spacy.WandbLogger.v3" を指定し、さらに project_name を指定する必要があります。
spaCy のトレーニング用 config ファイルの仕組みや、トレーニングをカスタマイズするために渡せるその他のオプションについては、spaCy’s documentation を参照してください。
| Name | Description |
|---|---|
project_name | str。W&B Project の名前。まだ存在しない場合は、その Project が自動的に作成されます。 |
remove_config_values | List[str]。W&B にアップロードする前に config から除外する値のリスト。デフォルトは []。 |
model_log_interval | Optional int。デフォルトは None。設定すると、model versioning と Artifacts によるモデルのバージョン管理が有効になります。モデルのチェックポイントをログする間隔 (ステップ数) を指定します。デフォルトは None。 |
log_dataset_dir | Optional str。パスを指定すると、トレーニング開始時にそのデータセットが Artifact としてアップロードされます。デフォルトは None。 |
entity | Optional str。指定した場合、run は指定された entity 内に作成されます。 |
run_name | Optional str。指定した場合、run は指定された名前で作成されます。 |
トレーニングを開始する
WandbLogger を追加したら、通常どおり spacy train を実行できます。
- コマンドライン
- Python
- Python notebook