AI en machine learning
GGUF, GPTQ, AWQ, EXL2: hoe LLM-kwantisatieformaten daadwerkelijk geheugen gebruiken
Vergelijk het geheugengebruik van GGUF, GPTQ, AWQ en EXL2, van Q4_K_M-bestandsgrootte tot KV-cachegroei en runtime-overhead.
Brian 12 min leestijd