Calcolatore staticoOnlineStrumenti IA

Calcolatore di VRAM GPU

Stima la VRAM della GPU necessaria per eseguire o addestrare un modello.

Nota sulla privacy. Funziona nel tuo browser. I valori che inserisci restano in questa pagina e non vengono inviati da nessuna parte.
Ad esempio, un modello da 7B è 7.
Una precisione inferiore (quantizzazione) usa meno byte per parametro.
2 per una cache KV in fp16, 1 per 8 bit.
Memoria aggiuntiva per attivazioni e buffer di runtime.
Aggiunge i gradienti e lo stato dell'ottimizzatore Adam ai pesi.
Sono stime approssimative. L'uso reale della VRAM dipende dal framework, dal kernel di attenzione e dal runtime; verifica sempre prima di acquistare l'hardware.
Pesi del modello13 GiB
Cache KV2 GiB
Sovraccarico di attivazione3 GiB
VRAM totale stimata18 GiB

Prossimi passi consigliati

Strumenti correlati

Domande frequenti

I pesi derivano dal numero di parametri moltiplicato per i byte per parametro della precisione scelta (fp16 = 2, 8 bit = 1, 4 bit = 0,5). A ciò si aggiunge la cache KV (che cresce con la dimensione nascosta, i livelli, la lunghezza del contesto e la dimensione del batch) più un sovraccarico di attivazione configurabile. La modalità di addestramento aggiunge anche i gradienti e lo stato dell'ottimizzatore Adam.

Ultimo aggiornamento: 2026-06-23.