استدلال LLM من API
شغّل نماذج LLM المضغوطة من فئة 7B–70B خلف نقطة نهاية متوافقة مع OpenAI. vLLM أو TGI على GPU، وllama.cpp / Ollama على CPU القوية. احسب فواتير عملائك بالرمز المميز.
اختر دولة لعرض Cloudzy بلغتك.
استضافة VPS للذكاء الاصطناعي
CPU عالي RAM للاستدلال وRAG، أو GPU بمعايير NVIDIA للتدريب، كلاهما في لوحة VPS ذاتها.
سحابة مستقلة منذ عام ٢٠٠٨. من ٢٫٤٨ دولار/شهر · root SSH في ٦٠ ثانية.
CPU من $2.48/mo · خطط GPU بـ تسعير · ضمان استرداد المبلغ لمدة ١٤ يوماً
نظرة عامة على VPS للذكاء الاصطناعي
Cloudzy يوفر استضافة VPS للذكاء الاصطناعي بصيغتين: خطط CPU عالية الأداء RAM للاستدلال المكثف LLM، وRAG، والمسارات البرمجية، إضافةً إلى NVIDIA-class خطط GPU للتدريب وتشغيل النماذج الكبيرة. تعمل الخطط على AMD EPYC, تخزين NVMe، و 40 Gbps روابط صاعدة عبر ١٢ منطقة. يبدأ CPU من $2.48 per month؛ ويستغرق التوفير ٦٠ ثانية؛ وصور CUDA مُدمجة مسبقًا في خطط GPU. تعمل Cloudzy باستقلالية منذ 2008، وتخدم أكثر من ١٢٢٬٠٠٠ مطوّر، وحصلت على تقييم 4.6 / 5 by 728+ reviewers على Trustpilot.
لماذا يختار مطورو الذكاء الاصطناعي Cloudzy
أربعة أسباب تجعل هذه المنصة الخيار الأمثل لأعباء عمل الذكاء الاصطناعي لديك.
أحدث EPYC لاستدلال CPU، وNVMe لتحميل النماذج بسرعة. وحدات GPU مخصصة عبر PCI passthrough في خطط GPU.
اختبر زمن الاستدلال الفعلي على Cloudzy. إن لم يلبِّ متطلبات SLO الخاصة بك، نضمن لك استرداد المبلغ خلال ١٤ يوماً.
أعباء عمل الذكاء الاصطناعي في بيئة الإنتاج تحتاج إلى مضيف لا يعيد تشغيله في أوقات الذروة. بيانات SLA لآخر ٣٠ يوماً منشورة للعموم على status.cloudzy.com.
تواجه مشكلة في إصدارات CUDA أو أخطاء NCCL أو ضبط vLLM؟ مهندسون متخصصون في أعباء عمل الذكاء الاصطناعي، يردون في دقائق لا ساعات.
حزمة الذكاء الاصطناعي
PyTorch وTensorFlow وJAX وvLLM وTGI وOllama وllama.cpp وsglang، جميعها تعمل بلا مشكلات. صور CUDA مُعدَّة مسبقاً في خطط GPU تُغني عن إعداد التعريفات يدوياً. خطط CPU مناسبة للاستدلال الكمّي وعمال التضمين بتكلفة منخفضة.
حالات الاستخدام
شغّل نماذج LLM المضغوطة من فئة 7B–70B خلف نقطة نهاية متوافقة مع OpenAI. vLLM أو TGI على GPU، وllama.cpp / Ollama على CPU القوية. احسب فواتير عملائك بالرمز المميز.
Postgres مع pgvector أو Qdrant على VPS من نوع CPU، مع خيار إضافة صندوق GPU للتضمين والتوليد. NVMe يجعل عمليات البحث في المتجهات سريعة دائماً.
وكلاء LangChain أو LlamaIndex طويلة الأمد تستدعي APIs من OpenAI/Anthropic وبياناتك الخاصة. IP ثابت يُبقي استدعاء الأدوات مستقراً.
Stable Diffusion وSDXL وComfyUI ونماذج الفيديو على GPUs من فئة RTX. NVMe يتيح لك تبديل النماذج في ثوانٍ لا دقائق.
الضبط الدقيق بـLoRA / QLoRA على فئة RTX، والتدريب الكامل للمعاملات على GPUs من فئة مراكز البيانات. CUDA وNCCL وPyTorch مثبّتة مسبقاً.
شغّل عامل sentence-transformers على VPS من نوع CPU بحجم 16–32 GB لتضمين ملايين المستندات دون دفع أسعار SaaS لكل طلب.
شبكة عالمية
ضع API الذكاء الاصطناعي قريباً من عملائك. اجمع بوابة CPU في منطقة مع صندوق GPU في منطقة أخرى.
خطط CPU للذكاء الاصطناعي
كثير من أعباء عمل الذكاء الاصطناعي مرتبطة بـCPU. فوترة بالساعة · خصم ٥٠٪ على جميع الخطط · خطط GPU مدرجة بشكل منفصل في /pricing.
استدلال 7B المضغوط · CPU
RAG backend · قاعدة بيانات متجهية · embeddings
استدلال CPU متوسط الحجم · بوابة API
CPU كبير الحجم · agents · pipelines
الأسئلة الشائعة. خادم AI VPS
اختر المواصفات التي يحتاجها حملك. CPU للاستدلال وRAG؛ GPU للتدريب. لوحة تحكم واحدة.
لا حاجة لبطاقة ائتمان · ضمان استرداد المبلغ خلال ١٤ يومًا · إلغاء في أي وقت