Passer au contenu principal
Cette page présente un aperçu complet de l’infrastructure et des prérequis logiciels pour déployer W&B Autogéré. Consultez ces prérequis avant de commencer votre déploiement.
W&B recommande des types de déploiement entièrement gérés, tels que W&B Cloud mutualisé ou W&B Cloud dédié. Les services W&B entièrement gérés sont simples à utiliser et sécurisés, avec une configuration minimale, voire aucune configuration.
Pour des recommandations d’architecture détaillées, voir l’architecture de référence.

Exigences relatives aux versions logicielles

LogicielVersion minimale
Kubernetesv1.32 ou ultérieure (Versions de Kubernetes prises en charge)
Helmv3.x
MySQLv8.0.x est requis ; v8.0.32 ou ultérieure ; v8.0.44 ou ultérieure est recommandée.
Les versions Aurora MySQL 3.x doivent être en v3.05.2 ou ultérieure
Redisv7.x

Configuration matérielle requise

Architecture CPU : W&B fonctionne uniquement sur des processeurs Intel (x86). ARM n’est pas pris en charge. Dimensionnement : Pour les recommandations de dimensionnement du processeur, de la mémoire et du disque pour les nœuds Kubernetes et MySQL, consultez la section Dimensionnement de l’architecture de référence. Les exigences varient selon que vous exécutez Models, Weave ou les deux. Pour obtenir des recommandations détaillées sur le dimensionnement selon votre cas d’utilisation (Models uniquement, Weave uniquement, ou les deux), consultez la section sur le dimensionnement de l’architecture de référence.

Kubernetes

W&B Server est déployé sous la forme d’un opérateur Kubernetes qui gère plusieurs pods. Votre cluster Kubernetes doit respecter les exigences suivantes :
  • Version : Voir Exigences relatives aux versions logicielles ci-dessus
  • Contrôleur d’ingress : Un contrôleur d’ingress entièrement configuré et opérationnel (Nginx, Istio, Traefik ou ingress d’un cloud provider)
  • Volumes persistants : Capacité à provisionner des volumes persistants
  • Architecture CPU : Intel ou AMD 64 bits (ARM n’est pas pris en charge)
W&B prend en charge le déploiement sur des clusters Kubernetes OpenShift dans des environnements cloud, sur site et isolés du réseau. Pour obtenir des instructions de configuration spécifiques, voir la section OpenShift dans le guide de l’opérateur. Pour connaître l’ensemble des exigences Kubernetes, y compris la configuration de l’équilibreur de charge et de l’ingress, voir la section Kubernetes de l’architecture de référence.

Base de données MySQL

W&B nécessite une base de données MySQL externe. Pour la Production, W&B recommande fortement d’utiliser des services de base de données gérés : Les services de base de données gérés offrent des sauvegardes automatisées, de la supervision, une haute disponibilité et l’application des correctifs, tout en réduisant la charge opérationnelle. Voir l’architecture de référence pour connaître l’ensemble des exigences MySQL, y compris les recommandations de dimensionnement et les paramètres de configuration. Pour le SQL de création de la base de données, consultez le guide bare-metal. Pour toute question sur la configuration de la base de données de votre déploiement, contactez l’assistance ou votre AISE. W&B recommande vivement d’utiliser des services de base de données managés tels qu’AWS RDS Aurora MySQL, Google Cloud SQL for MySQL ou Azure Database for MySQL pour les déploiements en Production. Les services managés assurent des sauvegardes automatisées, la supervision, la haute disponibilité, l’application des correctifs et réduisent considérablement la complexité opérationnelle.

Paramètres de configuration MySQL

Si vous utilisez votre propre instance MySQL, configurez MySQL avec ces paramètres :
binlog_format = 'ROW'
binlog_row_image = 'MINIMAL'
innodb_flush_log_at_trx_commit = 1
innodb_online_alter_log_max_size = 268435456
max_prepared_stmt_count = 1048576
sort_buffer_size = '67108864'
sync_binlog = 1
Ces paramètres ont été validés par W&B afin de garantir des performances et une fiabilité optimales.

Création de la base de données

Pour obtenir des instructions sur la création manuelle de la base de données MySQL et de l’utilisateur : Créez une base de données et un utilisateur à l’aide des commandes SQL suivantes. Remplacez SOME_PASSWORD par un mot de passe robuste de votre choix :
CREATE USER 'wandb_local'@'%' IDENTIFIED BY 'SOME_PASSWORD';
CREATE DATABASE wandb_local CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
GRANT ALL ON wandb_local.* TO 'wandb_local'@'%' WITH GRANT OPTION;
Pour des considérations supplémentaires, notamment sur les sauvegardes, les performances, la surveillance et la disponibilité, voir la section MySQL de l’architecture de référence.

Redis

W&B dépend d’un déploiement Redis 7.x à nœud unique, utilisé par les composants de W&B pour mettre les jobs en file d’attente et mettre les données en cache. Pour plus de commodité lors des tests et du développement de preuves de faisabilité, W&B Self-Managed inclut un déploiement Redis local qui n’est pas adapté aux déploiements de production. Pour les déploiements de production, W&B peut se connecter à une instance Redis dans les environnements suivants : W&B peut se connecter à une instance Redis dans les environnements suivants :

Stockage d’objets

W&B requiert un stockage d’objets prenant en charge les URL pré-signées et CORS. Fournisseurs de stockage recommandés :
  • Amazon S3 : service de stockage d’objets offrant une évolutivité, une disponibilité des données, une sécurité et des performances de premier plan.
  • Google Cloud Storage : service géré permettant de stocker des données non structurées à grande échelle.
  • Azure Blob Storage : solution de stockage d’objets cloud pour stocker de grandes quantités de données non structurées.
  • CoreWeave AI Object Storage : service de stockage d’objets hautes performances, compatible S3, optimisé pour les charges de travail d’IA.
  • Stockage compatible S3 pour les entreprises : MinIO Enterprise (AIStor), NetApp StorageGRID ou d’autres solutions de niveau entreprise
MinIO Open Source est en mode de maintenance, sans développement actif ni binaires précompilés. Pour les déploiements de production, W&B recommande d’utiliser des services de stockage d’objets gérés ou des solutions compatibles S3 pour les entreprises, telles que MinIO Enterprise (AIStor).
Pour des instructions détaillées sur le provisionnement du bucket, y compris les stratégies IAM, la configuration CORS et la configuration de l’accès, voir le guide Bring Your Own Bucket (BYOB). Voir la section sur le stockage d’objets de l’architecture de référence pour connaître l’ensemble des exigences.

Provisionnez votre bucket de stockage

Avant de configurer W&B, provisionnez votre bucket de stockage d’objets avec les politiques IAM appropriées, une configuration CORS et les identifiants d’accès nécessaires. Voir le guide Bring Your Own Bucket (BYOB) pour obtenir des instructions de provisionnement détaillées, étape par étape, pour :
  • Amazon S3 (y compris les politiques IAM et les politiques de bucket)
  • Google Cloud Storage (y compris les notifications PubSub)
  • Azure Blob Storage (y compris les identités gérées)
  • CoreWeave AI Object Storage
  • stockage compatible S3 (MinIO Enterprise, NetApp StorageGRID et d’autres solutions d’entreprise)

Configurer W&B pour utiliser votre bucket

Une fois votre bucket provisionné, configurez W&B pour l’utiliser dans les valeurs Helm de l’opérateur. Voir la section de configuration du stockage d’objets de l’opérateur pour plus de détails.

Réseau

Pour un déploiement connecté au réseau, un accès sortant à ces endpoints est requis à la fois pendant l’installation et à l’exécution :
Des registres de conteneurs supplémentaires peuvent être requis selon votre configuration de déploiement :
  • https://gcr.io est nécessaire lors du déploiement de Bufstream et d’etcd pour les évaluations en ligne de Weave.
Pour en savoir plus sur les déploiements air-gapped, consultez l’opérateur Kubernetes pour les instances air-gapped. L’accès à W&B et au stockage d’objets est requis pour l’infrastructure d’entraînement ainsi que pour chaque système utilisé pour suivre les besoins des expériences.

DNS

Le nom de domaine complet (FQDN) du déploiement W&B doit pointer vers l’adresse IP de l’ingress/équilibreur de charge au moyen d’un enregistrement A.

Équilibreur de charge et ingress

L’opérateur Kubernetes W&B expose des services à l’aide d’un contrôleur d’ingress Kubernetes, qui les achemine vers les points de terminaison de service en fonction des chemins d’URL. Le contrôleur d’ingress doit être accessible depuis toutes les machines qui exécutent des charges de travail de machine learning ou accèdent au service via un navigateur web. Pour plus de détails sur les options d’équilibreur de charge, les exigences du contrôleur d’ingress et des exemples de configuration, voir la section sur l’équilibreur de charge de l’architecture de référence.

SSL/TLS

W&B exige un certificat SSL/TLS valide, signé par une autorité reconnue, pour sécuriser les communications entre les clients et le serveur. La terminaison SSL/TLS doit se faire au niveau de l’ingress/de l’équilibreur de charge. L’application W&B Server ne termine pas les connexions SSL ou TLS. Important : W&B ne prend pas en charge les certificats auto-signés ni les autorités de certification personnalisées. L’utilisation de certificats auto-signés entraînera des problèmes pour les utilisateurs et n’est pas prise en charge. Si possible, utiliser un service comme Let’s Encrypt est un excellent moyen de fournir des certificats approuvés à votre équilibreur de charge. Des services comme Caddy et Cloudflare gèrent le SSL pour vous. Si vos politiques de sécurité exigent une communication SSL au sein de vos réseaux de confiance, envisagez d’utiliser un outil comme Istio et des conteneurs sidecar.

Licence

Une licence W&B Server valide est requise pour tous les déploiements autogérés. Vous avez besoin d’une licence W&B pour déployer W&B Self-Managed.
  1. Si vous n’avez pas encore de compte W&B, créez-en un.
  2. Si vous avez besoin d’une licence d’essai Enterprise incluant l’assistance pour des fonctionnalités de sécurité importantes et d’autres capacités adaptées aux entreprises, soumettez une requête ou contactez votre équipe W&B.
  3. Sinon, ouvrez le Deploy Manager pour générer une licence d’essai gratuite. L’URL vous redirige vers un formulaire Obtenir une licence pour W&B Local. Fournissez les informations suivantes :
    • Le titulaire de la licence
    • Le type de déploiement
    • Un nom et une description facultative pour l’instance
  4. Cliquez sur Générer une clé de licence.
Une page s’affiche avec un aperçu de votre déploiement ainsi que de la licence associée à l’instance.

Étapes suivantes

Après vous être assuré que votre infrastructure répond à ces exigences :