GGUF, GPTQ, AWQ, EXL2: hoe LLM-kwantisatieformaten daadwerkelijk geheugen gebruiken
Vergelijk het geheugengebruik van GGUF, GPTQ, AWQ en EXL2, van Q4_K_M-bestandsgrootte tot KV-cachegroei en runtime-overhead.
Kies een land om Cloudzy in jouw taal te zien.
De Cloudzy-blog
VPS, AI-hosting, Linux, Windows, zelf-gehoste tools, geschreven door developers die de servers achter de woorden beheren.
Vergelijk het geheugengebruik van GGUF, GPTQ, AWQ en EXL2, van Q4_K_M-bestandsgrootte tot KV-cachegroei en runtime-overhead.
Unified memory stelt een compacte AI-pc in staat om 235B-klasse modellen te laden die geen enkele losse GPU met 24-32GB kan bevatten. Wat het is, waarom het werkt, en waarom groter
AMD draaide een model met 1 biljoen parameters op vier mini-pc's. Het echte verhaal is de architectuurtruc die het waar maakt, en de wachttijd van 40 seconden tot 4 minuten die het
How do AI models like GameNGen, Oasis, and Genie 3 generate playable games with no game engine? A clear look at how next-frame prediction works, why these worlds drift, and what th
Een eenvoudige VPS vervangt Zapier, Mailchimp, Plausible, betaalde GitHub en het grootste deel van je indie-SaaS-rekening. De uitgesproken stack, en wanneer je zelf-hosting moet ov
Self-hosted VPN solutions compared by use case: privacy exit node, team mesh, and anti-censorship. WireGuard, Tailscale, Hiddify, and honest trade-offs.
Neural rendering is AI that predicts pixels, lighting, and detail instead of computing them. Here is what it actually means, how DLSS fits, and what is real vs. hype.
Claude Code, Codex CLI, Gemini CLI en Cline vergeleken op flexibiliteit, autonomie, prijs en benchmarks, plus wat de afsluiting van Gemini CLI in 2026 betekent.
Rocket.Chat, Mattermost, Element, Zulip: what self-hosting costs, where each one breaks, and what Mattermost v11 changed for the free tier.
Build a self-hosted privacy stack that actually works. Five layers across VPN, passwords, search, files, and chat, with a real threat model and VPS sizing.
Werkende configuraties voor Ruff, ESLint v10 en golangci-lint, afgestemd op AI-gegenereerde code, plus een pre-commit gate die de agent niet kan overslaan.
Eén enkel markdown-bestand vertelde zojuist 178.000 ontwikkelaars hoe ze AI zich kunnen laten gedragen. Beveiligingsagents, toegankelijkheidsregels, normalisatie-instanties, wat er