Maximiser l'Utilisation des Ressources GPU pour l'IA Générative dans un Environnement OpenStack et Kubernetes (Français)

Overview

Découvrez dans cette présentation en français de l'OpenInfra Day France 2024 comment optimiser l'utilisation des ressources GPU pour l'intelligence artificielle générative dans les environnements OpenStack et Kubernetes. Explorez les différentes stratégies et technologies permettant d'améliorer l'efficacité des GPU pour les tâches de calcul complexes, notamment les mécanismes de concurrence NVIDIA vGPU, CUDA streams, Time-slicing, CUDA Multi-Process Service, NVIDIA Multi-instance GPU (MIG) et AMD SR-IOV. Apprenez à adapter l'accélération GPU selon les besoins spécifiques de chaque charge de travail, qu'il s'agisse d'inférence ou d'entraînement de modèles d'IA, tout en réduisant les coûts opérationnels. Obtenez des conseils pratiques pour configurer et optimiser vos déploiements d'IA générative, présentés par Erwan Gallen de Red Hat.