Avec l’essor de l’intelligence artificielle, de la 3D, du calcul scientifique et du rendu, la virtualisation GPU devient un enjeu stratégique. Ce guide vous montre comment créer un environnement GPU-ready sur Proxmox VE, avec SR-IOV et NVIDIA GRID, adapté à un datacenter moderne.
Prérequis
- Un serveur compatible avec les cartes NVIDIA Tesla, A100, L40 ou RTX.
- Une carte NVIDIA supportant vGPU et SR-IOV (ex. Tesla T4, A16, A100).
- Accès au portail NVIDIA Licensing (GRID vGPU Software).
- Proxmox VE installé (v7.4+ recommandé).
- Accès SSH root.
Étape 1 : Préparer l’environnement système
Mise à jour et installation des outils de base
apt update && apt full-upgrade -y
apt install -y pve-headers-$(uname -r) build-essential
Désactivation du nouveau driver open source (Nouveau)
echo 'blacklist nouveau' > /etc/modprobe.d/blacklist-nouveau.conf
update-initramfs -u
reboot
Étape 2 : Installer le driver NVIDIA officiel
- Télécharger le pilote depuis nvidia.com.
- Rendre le script exécutable et lancer l’installation :
chmod +x NVIDIA-Linux-*.run
./NVIDIA-Linux-*.run
⚠️ Désactivez temporairement le service Proxmox UI (
systemctl stop pve-cluster pvedaemon
) pendant l’installation si nécessaire.
Vérification
nvidia-smi
Vous devriez voir la carte, la version du driver et l’état.
Étape 3 : Activer SR-IOV pour le GPU
Certaines cartes comme la NVIDIA A100 ou L40 supportent SR-IOV GPU, permettant d'exposer des VFs (Virtual Functions).
Exemple avec un A100 ou L40
echo 16 > /sys/class/drm/card0/device/sriov_numvfs
Vous verrez les VFs créées dans /sys/class/drm/
ou /sys/bus/pci/devices/
.
Étape 4 : Installer NVIDIA GRID et le mode vGPU
- Télécharger le vGPU Manager depuis le portail NVIDIA Licensing (nécessite contrat).
- Extraire et installer le paquet DEB correspondant au kernel Proxmox.
dpkg -i nvidia-vgpu-ubuntu*.deb
- Redémarrer le serveur.
Attribution d’une vGPU à une VM Proxmox
-
Créer une VM avec UEFI activé.
-
Dans la configuration matérielle, ajouter un périphérique PCI :
- Sélectionner une VF du GPU
- Activer IOMMU, All Functions, PCIe passthrough
Exemple de configuration VM (qm)
qm set 100 -machine q35 -hostpci0 0000:af:00.4,pcie=1,rombar=0
🔐 Activez IOMMU dans le BIOS et dans le GRUB de Proxmox :
intel_iommu=on
ouamd_iommu=on
Étape 5 : Gestion des licences NVIDIA GRID
- Installer le license server sur une VM dédiée (Linux ou Windows).
- Activer la clé de licence reçue depuis NVIDIA.
- Les VMs clientes avec vGPU communiquent avec le serveur de licence au démarrage.
Vérification depuis une VM
nvidia-smi
La VM doit voir une carte vGPU attachée, avec information de licensing.
Étape 6 : Benchmarks et supervision GPU
Benchmark avec glmark2
apt install -y glmark2
DISPLAY=:0 glmark2
Monitoring GPU dans Proxmox
Ajoutez un hook script pour extraire les métriques NVIDIA via nvidia-smi
dans vos exports Prometheus ou dashboards Grafana.
Cas d’usage
- IA/ML : PyTorch, TensorFlow en environnement virtualisé
- Rendu 3D : Blender, Unreal, Autodesk
- Desktop distant GPU-accelerated (Windows + RDP/PCoIP)
- Environnement de développement IA
Avantages d’une plateforme GPU-ready avec Proxmox
Critère | Avantage |
Coût | Évite les solutions cloud coûteuses |
Souveraineté | Données et GPU dans votre datacenter |
Flexibilité | Passthrough, SR-IOV, vGPU selon l’usage |
Performance | Faible overhead avec PCIe direct |
Sécurité | Isolation VM complète avec IOMMU + vGPU |
Conclusion
Mettre en place une plateforme GPU-ready avec Proxmox, SR-IOV et NVIDIA GRID permet de répondre aux nouveaux besoins du cloud souverain, de l’IA, du rendu et du VDI haute performance. Grâce à ce guide, vous avez désormais tous les éléments pour construire une infrastructure à la fois puissante, flexible et évolutive.