CustomJob du SDK google-cloud-aiplatform. Les paramètres d’un CustomJob peuvent être définis via la configuration de la file d’attente Launch. Vertex AI ne peut pas être configuré pour récupérer des images depuis un registre privé situé hors de Google Cloud. Cela signifie que vous devez stocker les images de conteneur dans Google Cloud ou dans un registre public si vous souhaitez utiliser Vertex AI avec W&B Launch. Voir la documentation de Vertex AI pour plus d’informations sur la façon de rendre les images de conteneur accessibles aux jobs Vertex.
Prérequis
- Créez un projet Google Cloud, ou accédez à un projet Google Cloud, avec l’API Vertex AI activée. Voir la documentation de la console des API Google Cloud pour plus d’informations sur l’activation d’une API.
- Créez un dépôt Google Cloud Artifact Registry pour stocker les images que vous souhaitez exécuter sur Vertex. Voir la documentation Google Cloud Artifact Registry pour plus d’informations.
- Créez un bucket GCS de staging pour que Vertex AI y stocke ses métadonnées. Notez que ce bucket doit se trouver dans la même région que vos charges de travail Vertex AI pour pouvoir être utilisé comme bucket de staging. Le même bucket peut être utilisé pour les contextes de staging et de build.
- Créez un compte de service avec les autorisations nécessaires pour lancer des jobs Vertex AI. Voir la documentation Google Cloud IAM pour plus d’informations sur l’attribution des autorisations aux comptes de service.
- Accordez à votre compte de service l’autorisation de gérer les jobs Vertex
| Autorisation | Portée de la ressource | Description |
|---|---|---|
aiplatform.customJobs.create | Projet Google Cloud spécifié | Permet de créer de nouveaux jobs de machine learning dans le projet. |
aiplatform.customJobs.list | Projet Google Cloud spécifié | Permet de lister les jobs de machine learning dans le projet. |
aiplatform.customJobs.get | Projet Google Cloud spécifié | Permet de récupérer des informations sur des jobs de machine learning spécifiques dans le projet. |
Si vous souhaitez que vos charges de travail Vertex AI s’exécutent avec l’identité d’un compte de service non standard, référez-vous à la documentation Vertex AI pour obtenir des instructions sur la création de comptes de service et les autorisations nécessaires. Le champ
spec.service_account de la configuration de la file d’attente Launch peut être utilisé pour sélectionner un compte de service personnalisé pour vos runs W&B.Configurer une file d’attente pour Vertex AI
CustomJob dans le SDK Python Vertex AI, ainsi qu’à la méthode run de CustomJob. Les configurations de ressources sont stockées sous les clés spec et run :
- La clé
speccontient les valeurs des arguments nommés du constructeurCustomJobdans le SDK Python Vertex AI. - La clé
runcontient les valeurs des arguments nommés de la méthoderunde la classeCustomJobdans le SDK Python Vertex AI.
spec.worker_pool_specs. Une spécification de pool de workers définit un groupe de workers qui exécuteront votre job. La spécification de worker de la configuration par défaut demande une seule machine n1-standard-4 sans accélérateur. Vous pouvez modifier le type de machine, le type d’accélérateur et le nombre d’accélérateurs selon vos besoins.
Pour plus d’informations sur les types de machines et d’accélérateurs disponibles, voir la Vertex AI documentation.
Créer une file d’attente
- Accédez à la page Launch.
- Cliquez sur le bouton Créer une file d’attente.
- Sélectionnez l’Entité dans laquelle vous souhaitez créer la file d’attente.
- Saisissez un nom pour votre file d’attente dans le champ Nom.
- Sélectionnez Google Cloud Vertex AI comme Ressource.
- Dans le champ Configuration, indiquez les informations relatives au
CustomJobVertex AI que vous avez défini dans la section précédente. Par défaut, W&B préremplit un corps de requête YAML et JSON similaire à celui-ci :
- Après avoir configuré votre file d’attente, cliquez sur le bouton Créer une file d’attente.
spec.worker_pool_specs: liste non vide de spécifications de pool de workers.spec.staging_bucket: bucket GCS utilisé pour le staging des assets et des métadonnées Vertex AI.
Configurer un agent Launch
~/.config/wandb/launch-config.yaml.