Azure OpenAI ファインチューニング - Weights & Biases Documentation

はじめに
前提条件
ワークフローの概要
1. ファインチューニングのセットアップ
2. 実験トラッキング
3. モデル評価
実際の利用例
追加リソース

はじめに

Microsoft Azure 上で GPT-3.5 または GPT-4 モデルをファインチューニングする際に W&B を使用すると、メトリクスを自動的に記録し体系的な評価を行える W&B の実験トラッキングおよび評価ツールにより、モデルのパフォーマンスを追跡・分析・改善できます。

Azure OpenAI fine-tuning metrics

前提条件

公式の Azure ドキュメントに従って Azure OpenAI サービスをセットアップします。
W&B アカウントおよび APIキーを設定します。

ワークフローの概要

1. ファインチューニングのセットアップ

Azure OpenAI の要件に従って学習データを準備します。
Azure OpenAI でファインチューニングジョブを設定します。
W&B がファインチューニングプロセスを自動的に追跡し、メトリクスとハイパーパラメータを記録します。

2. 実験トラッキング

ファインチューニング中、W&B は次の内容を記録します:

学習および検証のメトリクス
モデルのハイパーパラメータ
リソース使用状況
学習アーティファクト

3. モデル評価

ファインチューニング後は、W&B Weave を使用して次のことを行います：

参照データセットに対するモデル出力を評価する
異なるファインチューニング run 間で性能を比較する
特定のテストケースにおけるモデルの挙動を分析する
モデル選択のためにデータに基づいた意思決定を行う

実際の利用例

medical note generation デモを開いて、このインテグレーションが次のように役立つ様子を確認してください:
- ファインチューニング Experiments の体系的なトラッキング
- ドメイン固有のメトリクスを用いたモデル評価
ノートブックのファインチューニングを体験できるインタラクティブなデモを実行してみてください

追加リソース

PyTorch torchtune

OpenAI モデルのファインチューニング

⌘I