Passer au contenu principal
Hydra est un framework Python open source qui simplifie le développement d’applications de recherche et d’autres applications complexes. Sa principale fonctionnalité est de permettre la création dynamique d’une configuration hiérarchique par composition, puis sa surcharge via des fichiers de configuration et la ligne de commande.
Vous pouvez continuer à utiliser Hydra pour gérer la configuration tout en tirant parti de la puissance de W&B.

Suivre les métriques

Suivez vos métriques normalement avec wandb.init() et wandb.Run.log(). Ici, wandb.entity et wandb.project sont définis dans un fichier de configuration Hydra.
import wandb


@hydra.main(config_path="configs/", config_name="defaults")
def run_experiment(cfg):

    with wandb.init(entity=cfg.wandb.entity, project=cfg.wandb.project) as run:
      run.log({"loss": loss})

Suivre les hyperparamètres

Hydra utilise omegaconf comme interface par défaut pour les dictionnaires de configuration. Les dictionnaires d’OmegaConf ne sont pas une sous-classe des dictionnaires primitifs. Par conséquent, passer directement le Config de Hydra à wandb.Run.config peut produire des résultats inattendus dans le tableau de bord. Vous devez convertir omegaconf.DictConfig en type primitif dict avant de le transmettre à wandb.Run.config.
@hydra.main(config_path="configs/", config_name="defaults")
def run_experiment(cfg):
  with wandb.init(entity=cfg.wandb.entity, project=cfg.wandb.project) as run:
    run.config = omegaconf.OmegaConf.to_container(
        cfg, resolve=True, throw_on_missing=True
    )
    run = wandb.init(entity=cfg.wandb.entity, project=cfg.wandb.project)
    run.log({"loss": loss})
    model = Model(**run.config.model.configs)

Résoudre les problèmes liés au multiprocessing

Si votre processus se bloque au démarrage, cela peut être dû à ce problème connu. Pour y remédier, essayez de modifier le protocole de multiprocessing de wandb, en ajoutant par exemple un paramètre de configuration supplémentaire à wandb.init() comme suit :
wandb.init(settings=wandb.Settings(start_method="thread"))
ou en définissant une variable d’environnement globale dans votre shell :
$ export WANDB_START_METHOD=thread

Optimiser les hyperparamètres

W&B Sweeps est une plateforme de recherche d’hyperparamètres très évolutive, qui fournit des insights et des visualisations sur les expériences W&B avec un minimum de code. Sweeps s’intègre parfaitement aux projets Hydra sans nécessiter d’écrire de code. La seule chose requise est un fichier de configuration décrivant, comme d’habitude, les différents paramètres à balayer. Un exemple simple de fichier sweep.yaml serait :
program: main.py
method: bayes
metric:
  goal: maximize
  name: test/accuracy
parameters:
  dataset:
    values: [mnist, cifar10]

command:
  - ${env}
  - python
  - ${program}
  - ${args_no_hyphens}
Exécutez le balayage :
wandb sweep sweep.yaml
W&B crée automatiquement un balayage dans votre projet et renvoie une commande wandb agent à exécuter sur chaque machine où vous souhaitez lancer ce balayage.

Passer des paramètres non présents dans les valeurs par défaut d’Hydra

Hydra prend en charge le passage de paramètres supplémentaires via la ligne de commande qui ne figurent pas dans le fichier de configuration par défaut, en utilisant un + avant la commande. Par exemple, vous pouvez passer un paramètre supplémentaire avec une certaine valeur en appelant simplement :
$ python program.py +experiment=some_experiment
Vous ne pouvez pas exécuter de balayage sur de telles configurations +, comme on le fait lors de la configuration des Hydra Expériences. Pour contourner ce problème, vous pouvez initialiser le paramètre d’expérience avec un fichier vide par défaut, puis utiliser W&B Sweep pour remplacer ces configurations vides à chaque appel. Pour plus d’informations, consultez ce Reports W&B.