Calculadora estáticaEn líneaHerramientas de IA

Calculadora de VRAM de GPU

Estima la VRAM de GPU necesaria para ejecutar o entrenar un modelo.

Nota de privacidad. Funciona en tu navegador. Los valores que introduces se quedan en esta página y no se envían a ningún sitio.
Por ejemplo, un modelo de 7B es 7.
Una precisión menor (cuantización) usa menos bytes por parámetro.
2 para una caché KV en fp16, 1 para 8 bits.
Memoria adicional para activaciones y búferes de ejecución.
Añade los gradientes y el estado del optimizador Adam sobre los pesos.
Son estimaciones aproximadas. El uso real de VRAM depende del framework, el núcleo de atención y el entorno de ejecución; verifícalo siempre antes de adquirir hardware.
Pesos del modelo13 GiB
Caché KV2 GiB
Sobrecoste de activaciones3 GiB
VRAM total estimada18 GiB

Próximos pasos recomendados

Herramientas relacionadas

Preguntas frecuentes

Los pesos salen del número de parámetros multiplicado por los bytes por parámetro de la precisión elegida (fp16 = 2, 8 bits = 1, 4 bits = 0,5). A eso se suma la caché KV (que crece con la dimensión oculta, las capas, la longitud de contexto y el tamaño de lote) más un sobrecoste de activaciones configurable. El modo de entrenamiento también añade los gradientes y el estado del optimizador Adam.

Última actualización: 2026-06-23.