GGUF, GPTQ, AWQ, EXL2: como os formatos de quantização de LLM realmente usam memória
Compare o uso de memória de GGUF, GPTQ, AWQ e EXL2, do tamanho de arquivo Q4_K_M ao crescimento do cache KV e ao overhead de runtime.
Selecione um país para ver o Cloudzy no seu idioma.
O blogue Cloudzy
VPS, hospedagem de IA, Linux, Windows, ferramentas auto-hospedadas, escritas por desenvolvedores que operam os servidores por trás das palavras.
Compare o uso de memória de GGUF, GPTQ, AWQ e EXL2, do tamanho de arquivo Q4_K_M ao crescimento do cache KV e ao overhead de runtime.
A memória unificada permite que um PC de IA compacto carregue modelos da classe 235B que nenhuma GPU única de 24-32GB consegue armazenar. O que é, por que funciona e por que maior
A AMD executou um modelo de 1 trilião de parâmetros em quatro mini PCs. A verdadeira história é o truque de arquitetura que o torna verdade, e a espera de 40 segundos a 4 minutos q
How do AI models like GameNGen, Oasis, and Genie 3 generate playable games with no game engine? A clear look at how next-frame prediction works, why these worlds drift, and what th
Um VPS simples substitui o Zapier, o Mailchimp, o Plausible, o GitHub pago, e a maior parte da sua fatura de SaaS indie. A stack opinativa, e quando saltar o self-hosting.
Self-hosted VPN solutions compared by use case: privacy exit node, team mesh, and anti-censorship. WireGuard, Tailscale, Hiddify, and honest trade-offs.
Neural rendering is AI that predicts pixels, lighting, and detail instead of computing them. Here is what it actually means, how DLSS fits, and what is real vs. hype.
Claude Code, Codex CLI, Gemini CLI e Cline comparados em flexibilidade, autonomia, preços e benchmarks, além do que o encerramento do Gemini CLI em 2026 significa.
Rocket.Chat, Mattermost, Element, Zulip: what self-hosting costs, where each one breaks, and what Mattermost v11 changed for the free tier.
Build a self-hosted privacy stack that actually works. Five layers across VPN, passwords, search, files, and chat, with a real threat model and VPS sizing.
Configurações funcionais de Ruff, ESLint v10 e golangci-lint ajustadas para código gerado por IA, mais uma barreira de pre-commit que o agente não consegue ignorar.
Um único ficheiro markdown acabou de dizer a 178.000 programadores como fazer a IA comportar-se. Agentes de segurança, regras de acessibilidade, organismos de normalização, o que e