GGUF, GPTQ, AWQ, EXL2: cómo usan realmente la memoria los formatos de cuantización de LLM
Compara el uso de memoria de GGUF, GPTQ, AWQ y EXL2, desde el tamaño del archivo Q4_K_M hasta el crecimiento de la caché KV y el sobrecoste del runtime.
Selecciona un país para ver Cloudzy en tu idioma.
El blog de Cloudzy
VPS, hosting con IA, Linux, Windows, herramientas autoalojadas. Escrito por desarrolladores que gestionan los servidores detrás de cada artículo.
Compara el uso de memoria de GGUF, GPTQ, AWQ y EXL2, desde el tamaño del archivo Q4_K_M hasta el crecimiento de la caché KV y el sobrecoste del runtime.
La memoria unificada permite que un PC de IA compacto cargue modelos de clase 235B que ninguna GPU única de 24-32 GB puede contener. Qué es, por qué funciona y por qué más grande n
AMD ejecutó un modelo de 1 billón de parámetros en cuatro mini PCs. La historia real es el truco de arquitectura que lo hace cierto, y la espera de 40 segundos a 4 minutos que la h
How do AI models like GameNGen, Oasis, and Genie 3 generate playable games with no game engine? A clear look at how next-frame prediction works, why these worlds drift, and what th
Un VPS sencillo reemplaza a Zapier, Mailchimp, Plausible, el GitHub de pago y la mayor parte de tu factura de SaaS indie. El stack con opinión, y cuándo saltarse el autoalojamiento
Self-hosted VPN solutions compared by use case: privacy exit node, team mesh, and anti-censorship. WireGuard, Tailscale, Hiddify, and honest trade-offs.
Neural rendering is AI that predicts pixels, lighting, and detail instead of computing them. Here is what it actually means, how DLSS fits, and what is real vs. hype.
Claude Code, Codex CLI, Gemini CLI y Cline comparados en flexibilidad, autonomía, precios y benchmarks, además de lo que significa el cierre de Gemini CLI en 2026.
Rocket.Chat, Mattermost, Element, Zulip: what self-hosting costs, where each one breaks, and what Mattermost v11 changed for the free tier.
Build a self-hosted privacy stack that actually works. Five layers across VPN, passwords, search, files, and chat, with a real threat model and VPS sizing.
Configuraciones funcionales de Ruff, ESLint v10 y golangci-lint ajustadas para código generado por IA, más una barrera pre-commit que el agente no puede saltarse.
Un solo archivo markdown acaba de decirle a 178.000 desarrolladores cómo hacer que la IA se comporte. Agentes de seguridad, reglas de accesibilidad, organismos de estandarización: