MosaicML Composer

Composer는 신경망을 더 잘, 더 빠르게, 더 저렴하게 트레이닝할 수 있도록 해주는 라이브러리입니다. 신경망 트레이닝을 가속하고 일반화 성능을 향상하는 다양한 최신 방법을 제공하며, 여러 개선 기법을 쉽게 조합할 수 있게 해주는 선택 사항인 Trainer API도 포함되어 있습니다. W&B는 ML 실험을 로깅하기 위한 경량 래퍼를 제공합니다. 하지만 이 둘을 직접 결합할 필요는 없습니다. W&B는 WandBLogger를 통해 Composer 라이브러리에 직접 통합되어 있습니다.

W&B 로깅 시작하기

from composer import Trainer
from composer.loggers import WandBLogger

trainer = Trainer(..., logger=WandBLogger())

Composer의 `WandBLogger` 사용

Composer 라이브러리는 Trainer에서 WandBLogger 클래스를 사용해 메트릭을 W&B에 로깅합니다. 로거를 생성해 Trainer에 전달하기만 하면 됩니다.

wandb_logger = WandBLogger(project="gpt-5", log_artifacts=True)
trainer = Trainer(logger=wandb_logger)

Logger 매개변수

아래는 WandbLogger의 매개변수입니다. 전체 목록과 설명은 Composer documentation을 참조하세요.

Parameter	Description
`project`	W&B 프로젝트 이름 (str, 선택)
`group`	W&B 그룹 이름 (str, 선택)
`name`	W&B run 이름입니다. 지정하지 않으면 State.run_name이 사용됩니다 (str, 선택)
`entity`	사용자 이름 또는 W&B Teams 이름과 같은 W&B entity 이름 (str, 선택)
`tags`	W&B 태그 (List[str], 선택)
`log_artifacts`	체크포인트를 wandb에 로깅할지 여부, 기본값: `false` (bool, 선택)
`rank_zero_only`	rank-zero 프로세스에서만 로깅할지 여부입니다. Artifacts를 로깅할 때는 모든 rank에서 로깅하는 것을 강력히 권장합니다. rank ≥1의 Artifacts는 저장되지 않으므로 중요한 정보가 누락될 수 있습니다. 예를 들어 Deepspeed ZeRO를 사용하는 경우, 모든 rank의 Artifacts가 없으면 체크포인트에서 복원할 수 없습니다. 기본값: `True` (bool, 선택)
`init_kwargs`	wandb `config` 등 `wandb.init()`에 전달할 매개변수입니다. `wandb.init()`에서 사용할 수 있는 매개변수는 `wandb.init()` parameters를 참조하세요.

일반적인 사용 예시는 다음과 같습니다.

init_kwargs = {"notes":"Testing higher learning rate in this experiment", 
               "config":{"arch":"Llama",
                         "use_mixed_precision":True
                         }
               }

wandb_logger = WandBLogger(log_artifacts=True, init_kwargs=init_kwargs)

예측 샘플 로깅

Composer’s Callbacks 시스템을 사용하면 WandBLogger를 통해 W&B에 언제 로깅할지 제어할 수 있습니다. 이 예제에서는 검증 이미지와 예측 샘플이 로깅됩니다:

import wandb
from composer import Callback, State, Logger

class LogPredictions(Callback):
    def __init__(self, num_samples=100, seed=1234):
        super().__init__()
        self.num_samples = num_samples
        self.data = []
        
    def eval_batch_end(self, state: State, logger: Logger):
        """배치별 예측을 계산하고 self.data에 저장합니다"""
        
        if state.timer.epoch == state.max_duration: #마지막 검증 에포크에서
            if len(self.data) < self.num_samples:
                n = self.num_samples
                x, y = state.batch_pair
                outputs = state.outputs.argmax(-1)
                data = [[wandb.Image(x_i), y_i, y_pred] for x_i, y_i, y_pred in list(zip(x[:n], y[:n], outputs[:n]))]
                self.data += data
            
    def eval_end(self, state: State, logger: Logger):
        with wandb.init() as run:
            "wandb.Table을 생성하고 로깅합니다"
            columns = ['image', 'ground truth', 'prediction']
            table = wandb.Table(columns=columns, data=self.data[:self.num_samples])
            run.log({'sample_table':table}, step=int(state.timer.batch))         
...

trainer = Trainer(
    ...
    loggers=[WandBLogger()],
    callbacks=[LogPredictions()]
)

Welcome to W&B

Products

Platform Details

Resources

W&B 로깅 시작하기

Composer의 `WandBLogger` 사용

Logger 매개변수

예측 샘플 로깅

Welcome to W&B

Products

Platform Details

Resources

​W&B 로깅 시작하기

​Composer의 WandBLogger 사용

​Logger 매개변수

​예측 샘플 로깅

W&B 로깅 시작하기

Composer의 `WandBLogger` 사용

Logger 매개변수

예측 샘플 로깅