メインコンテンツへスキップ

はじめに

Microsoft Azure 上で GPT-3.5 または GPT-4 モデルをファインチューニングする際に W&B を使用すると、メトリクスを自動的に記録し体系的な評価を行える W&B の実験トラッキングおよび評価ツールにより、モデルのパフォーマンスを追跡・分析・改善できます。
Azure OpenAI fine-tuning metrics

前提条件

ワークフローの概要

1. ファインチューニングのセットアップ

  • Azure OpenAI の要件に従って学習データを準備します。
  • Azure OpenAI でファインチューニングジョブを設定します。
  • W&B がファインチューニングプロセスを自動的に追跡し、メトリクスとハイパーパラメータを記録します。

2. 実験トラッキング

ファインチューニング中、W&B は次の内容を記録します:
  • 学習および検証のメトリクス
  • モデルのハイパーパラメータ
  • リソース使用状況
  • 学習アーティファクト

3. モデル評価

ファインチューニング後は、W&B Weave を使用して次のことを行います:
  • 参照データセットに対するモデル出力を評価する
  • 異なるファインチューニング run 間で性能を比較する
  • 特定のテストケースにおけるモデルの挙動を分析する
  • モデル選択のためにデータに基づいた意思決定を行う

実際の利用例

追加リソース