Calculateur statiqueEn ligneOutils IA

Calculateur de VRAM GPU

Estimez la VRAM GPU nécessaire pour exécuter ou entraîner un modèle.

Note de confidentialité. Fonctionne dans votre navigateur. Les valeurs que vous saisissez restent sur cette page et ne sont envoyées nulle part.
Par exemple, un modèle 7B vaut 7.
Une précision plus faible (quantification) utilise moins d'octets par paramètre.
2 pour un cache KV en fp16, 1 pour du 8 bits.
Mémoire supplémentaire pour les activations et les tampons d'exécution.
Ajoute les gradients et l'état de l'optimiseur Adam aux poids.
Ce sont des estimations approximatives. L'usage réel de la VRAM dépend du framework, du noyau d'attention et de l'environnement d'exécution ; vérifiez toujours avant de provisionner du matériel.
Poids du modèle13 Gio
Cache KV2 Gio
Surcoût d'activation3 Gio
VRAM totale estimée18 Gio

Prochaines étapes recommandées

Outils associés

Questions fréquentes

Les poids proviennent du nombre de paramètres multiplié par les octets par paramètre selon la précision choisie (fp16 = 2, 8 bits = 1, 4 bits = 0,5). On y ajoute le cache KV (qui croît avec la dimension cachée, les couches, la longueur de contexte et la taille du lot) ainsi qu'un surcoût d'activation configurable. Le mode entraînement ajoute aussi les gradients et l'état de l'optimiseur Adam.

Dernière mise à jour le 2026-06-23.