Maximiser l'Utilisation des Ressources GPU pour l'IA Générative dans un Environnement OpenStack et Kubernetes (Français)
OpenInfra Foundation via YouTube
Overview
Découvrez dans cette présentation en français de l'OpenInfra Day France 2024 comment optimiser l'utilisation des ressources GPU pour l'intelligence artificielle générative dans les environnements OpenStack et Kubernetes. Explorez les différentes stratégies et technologies permettant d'améliorer l'efficacité des GPU pour les tâches de calcul complexes, notamment les mécanismes de concurrence NVIDIA vGPU, CUDA streams, Time-slicing, CUDA Multi-Process Service, NVIDIA Multi-instance GPU (MIG) et AMD SR-IOV. Apprenez à adapter l'accélération GPU selon les besoins spécifiques de chaque charge de travail, qu'il s'agisse d'inférence ou d'entraînement de modèles d'IA, tout en réduisant les coûts opérationnels. Obtenez des conseils pratiques pour configurer et optimiser vos déploiements d'IA générative, présentés par Erwan Gallen de Red Hat.
Syllabus
Maximiser l'utilisation des ressources GPU pour l'IA générative (Français)
Taught by
OpenInfra Foundation