Avec l'essor de l'intelligence artificielle, de la 3D, du calcul scientifique et du rendu, la virtualisation GPU devient un enjeu stratégique. Ce guide vous montre comment créer un environnement GPU-ready sur Proxmox VE, avec SR-IOV et NVIDIA GRID, adapté à un datacenter moderne.
Prérequis
- Un serveur compatible avec les cartes NVIDIA Tesla, A100, L40 ou RTX.
- Une carte NVIDIA supportant vGPU et SR-IOV (ex. Tesla T4, A16, A100).
- Accès au portail NVIDIA Licensing (GRID vGPU Software).
- Proxmox VE installé (v8.0+ recommandé).
- Accès SSH root.
Étape 1 : Préparer l'environnement système
Mise à jour et installation des outils de base
apt update && apt full-upgrade -y
apt install -y pve-headers-$(uname -r) build-essential
Désactivation du nouveau driver open source (Nouveau)
echo 'blacklist nouveau' > /etc/modprobe.d/blacklist-nouveau.conf
update-initramfs -u
reboot
Étape 2 : Installer le driver NVIDIA officiel
- Télécharger le pilote depuis nvidia.com.
- Rendre le script exécutable et lancer l'installation :
chmod +x NVIDIA-Linux-*.run
./NVIDIA-Linux-*.run
⚠️ Désactivez temporairement le service Proxmox UI (systemctl stop pve-cluster pvedaemon) pendant l'installation si nécessaire.
Ressources complémentaires
- En savoir plus sur Proxmox vs VMware
- Découvrez le réseau SDN Proxmox
Vérification
nvidia-smi
Vous devriez voir la carte, la version du driver et l'état.
Étape 3 : Activer SR-IOV pour le GPU
Certaines cartes comme la NVIDIA A100 ou L40 supportent SR-IOV GPU, permettant d'exposer des VFs (Virtual Functions).
Exemple avec un A100 ou L40
echo 16 > /sys/class/drm/card0/device/sriov_numvfs
Vous verrez les VFs créées dans /sys/class/drm/ ou /sys/bus/pci/devices/.
Étape 4 : Installer NVIDIA GRID et le mode vGPU
- Télécharger le vGPU Manager depuis le portail NVIDIA Licensing (nécessite contrat).
- Extraire et installer le paquet DEB correspondant au kernel Proxmox.
dpkg -i nvidia-vgpu-ubuntu*.deb
- Redémarrer le serveur.
Attribution d'une vGPU à une VM Proxmox
- Créer une VM avec UEFI activé.
- Dans la configuration matérielle, ajouter un périphérique PCI :
- Sélectionner une VF du GPU
- Activer IOMMU, All Functions, PCIe passthrough
Exemple de configuration VM (qm)
qm set 100 -machine q35 -hostpci0 0000:af:00.4,pcie=1,rombar=0
🔐 Activez IOMMU dans le BIOS et dans le GRUB de Proxmox :
intel_iommu=onouamd_iommu=on
Étape 5 : Gestion des licences NVIDIA GRID
- Installer le license server sur une VM dédiée (Linux ou Windows).
- Activer la clé de licence reçue depuis NVIDIA.
- Les VMs clientes avec vGPU communiquent avec le serveur de licence au démarrage.
Vérification depuis une VM
nvidia-smi
La VM doit voir une carte vGPU attachée, avec information de licensing.
Étape 6 : Benchmarks et supervision GPU
Benchmark avec glmark2
apt install -y glmark2
DISPLAY=:0 glmark2
Monitoring GPU dans Proxmox
Ajoutez un hook script pour extraire les métriques NVIDIA via nvidia-smi dans vos exports Prometheus ou dashboards Grafana.
Cas d'usage
- IA/ML : PyTorch, TensorFlow en environnement virtualisé
- Rendu 3D : Blender, Unreal, Autodesk
- Desktop distant GPU-accelerated (Windows + RDP/PCoIP)
- Environnement de développement IA
Avantages d'une plateforme GPU-ready avec Proxmox
| Critère | Avantage |
| Coût | Évite les solutions cloud coûteuses |
| Souveraineté | Données et GPU dans votre datacenter |
| Flexibilité | Passthrough, SR-IOV, vGPU selon l'usage |
| Performance | Faible overhead avec PCIe direct |
| Sécurité | Isolation VM complète avec IOMMU + vGPU |
Conclusion
Déployer une plateforme GPU-ready avec Proxmox, SR-IOV et NVIDIA GRID couvre les besoins du cloud souverain, de l'IA, du rendu et du VDI haute performance. Vous avez maintenant les éléments pour construire une infrastructure modulable et évolutive.


