GGUF وGPTQ وAWQ وEXL2: كيف تستخدم صيغ تكميم LLM الذاكرة فعليًا
قارن استخدام الذاكرة بين GGUF وGPTQ وAWQ وEXL2، من حجم ملف Q4_K_M إلى نمو ذاكرة KV cache والنفقات الإضافية لبيئة التشغيل.
اختر بلدًا لعرض Cloudzy بلغتك.
مدونة Cloudzy
VPS، استضافة AI، Linux، Windows، أدوات مستضافة ذاتيًا، يكتبها مطورون يديرون الخوادم التي تقف خلف هذه الكلمات.
قارن استخدام الذاكرة بين GGUF وGPTQ وAWQ وEXL2، من حجم ملف Q4_K_M إلى نمو ذاكرة KV cache والنفقات الإضافية لبيئة التشغيل.
تتيح الذاكرة الموحدة لجهاز AI PC مدمج تحميل نماذج من فئة 235B لا يستطيع أي GPU منفرد بسعة 24-32GB استيعابها. ما هي، ولماذا تنجح، ولماذا لا يعني الأكبر الأسرع.
شغّلت AMD نموذجاً بتريليون معامل على أربعة أجهزة كمبيوتر مصغّرة. القصة الحقيقية هي الخدعة المعمارية التي تجعله صحيحاً، والانتظار بين 40 ثانية و4 دقائق الذي تتخطّاه ورقة المواصفات.
How do AI models like GameNGen, Oasis, and Genie 3 generate playable games with no game engine? A clear look at how next-frame prediction works, why these worlds drift, and what th
يستبدل VPS بسيط Zapier وMailchimp وPlausible وGitHub المدفوع، ومعظم فاتورة SaaS المستقلة لديك. المجموعة المدروسة برأي واضح، ومتى تتخطّى الاستضافة الذاتية.
Self-hosted VPN solutions compared by use case: privacy exit node, team mesh, and anti-censorship. WireGuard, Tailscale, Hiddify, and honest trade-offs.
Neural rendering is AI that predicts pixels, lighting, and detail instead of computing them. Here is what it actually means, how DLSS fits, and what is real vs. hype.
مقارنة بين Claude Code وCodex CLI وGemini CLI وCline من حيث المرونة والاستقلالية والتسعير والاختبارات المعيارية، إضافة إلى ما يعنيه إيقاف Gemini CLI في 2026.
Rocket.Chat, Mattermost, Element, Zulip: what self-hosting costs, where each one breaks, and what Mattermost v11 changed for the free tier.
Build a self-hosted privacy stack that actually works. Five layers across VPN, passwords, search, files, and chat, with a real threat model and VPS sizing.
إعدادات عملية لـ Ruff وESLint v10 وgolangci-lint مضبوطة للأكواد المولّدة بالذكاء الاصطناعي، إضافة إلى بوابة pre-commit لا يستطيع الوكيل تخطّيها.
ملف markdown واحد أخبر للتو 178,000 مطوّر بكيفية ضبط سلوك الذكاء الاصطناعي. وكلاء أمن، وقواعد وصولية، وهيئات معايير، ما الذي يحدث فعلًا.