خصم ٥٠٪ على جميع الخطط، لفترة محدودة. يبدأ من $2.48/mo

استضافة VPS للذكاء الاصطناعي

أعباء عمل الذكاء الاصطناعي،
اختر ما يناسبك.

CPU عالي RAM للاستدلال وRAG، أو GPU بمعايير NVIDIA للتدريب، كلاهما في لوحة VPS ذاتها.
سحابة مستقلة منذ عام ٢٠٠٨. من ٢٫٤٨ دولار/شهر · root SSH في ٦٠ ثانية.

4.6 · 728 reviews on Trustpilot

CPU من $2.48/mo · خطط GPU بـ تسعير · ضمان استرداد المبلغ لمدة ١٤ يوماً

~ ssh root@ai-nyc-001 متصل
root@ai-nyc-001:~# curl -fsSL https://ollama.com/install.sh | sh
جارٍ تثبيت Ollama runtime... اكتمل
root@ai-nyc-001:~# ollama run llama3.1:8b-instruct-q4
جارٍ سحب manifest · تنزيل ٤٫٧ GB إلى NVMe
النموذج جاهز · بدء CPU inference
root@ai-nyc-001:~# curl localhost:11434/api/generate -d '...'
{"response":"مرحباً! كيف يمكنني مساعدتك اليوم؟"}
root@ai-nyc-001:~# _

نظرة عامة على VPS للذكاء الاصطناعي

Cloudzy يوفر استضافة VPS للذكاء الاصطناعي بصيغتين: خطط CPU عالية الأداء RAM للاستدلال المكثف LLM، وRAG، والمسارات البرمجية، إضافةً إلى NVIDIA-class خطط GPU للتدريب وتشغيل النماذج الكبيرة. تعمل الخطط على AMD EPYC, تخزين NVMe، و 40 Gbps روابط صاعدة عبر ١٢ منطقة. يبدأ CPU من $2.48 per month؛ ويستغرق التوفير ٦٠ ثانية؛ وصور CUDA مُدمجة مسبقًا في خطط GPU. تعمل Cloudzy باستقلالية منذ 2008، وتخدم أكثر من ١٢٢٬٠٠٠ مطوّر، وحصلت على تقييم 4.6 / 5 by 728+ reviewers على Trustpilot.

يبدأ CPU من
$2.48 / month
أنواع GPU
RTX · Pro
التهيئة
٦٠ ثانية
المناطق
١٢ حول العالم
وقت التشغيل SLA
99.95%
استرداد المبالغ
١٤ يومًا

لماذا يختار مطورو الذكاء الاصطناعي Cloudzy

سحابة يُطلق نماذج الذكاء الاصطناعي.

أربعة أسباب تجعل هذه المنصة الخيار الأمثل لأعباء عمل الذكاء الاصطناعي لديك.

AMD EPYC + NVMe

أحدث EPYC لاستدلال CPU، وNVMe لتحميل النماذج بسرعة. وحدات GPU مخصصة عبر PCI passthrough في خطط GPU.

ضمان استرداد المال لمدة 14 يومًا

اختبر زمن الاستدلال الفعلي على Cloudzy. إن لم يلبِّ متطلبات SLO الخاصة بك، نضمن لك استرداد المبلغ خلال ١٤ يوماً.

وقت تشغيل ٩٩٫٩٥٪

أعباء عمل الذكاء الاصطناعي في بيئة الإنتاج تحتاج إلى مضيف لا يعيد تشغيله في أوقات الذروة. بيانات SLA لآخر ٣٠ يوماً منشورة للعموم على status.cloudzy.com.

مهندسون على المحادثة المباشرة

تواجه مشكلة في إصدارات CUDA أو أخطاء NCCL أو ضبط vLLM؟ مهندسون متخصصون في أعباء عمل الذكاء الاصطناعي، يردون في دقائق لا ساعات.

حزمة الذكاء الاصطناعي

أحضر أي إطار عمل تريده.
سيعمل.

PyTorch وTensorFlow وJAX وvLLM وTGI وOllama وllama.cpp وsglang، جميعها تعمل بلا مشكلات. صور CUDA مُعدَّة مسبقاً في خطط GPU تُغني عن إعداد التعريفات يدوياً. خطط CPU مناسبة للاستدلال الكمّي وعمال التضمين بتكلفة منخفضة.

Docker + nvidia-container-toolkit جاهزان في خطط GPU
PyTorch
CPU و GPU
TensorFlow
CPU و GPU
vLLM
خدمة GPU LLM
Ollama
CPU + وحدات GPU LLM
Hugging Face
Transformers · Diffusers
pgvector
مخزن متجهات RAG
Qdrant
قاعدة بيانات المتجهات
LangChain
إطار عمل الوكلاء

حالات الاستخدام

ما تعمل عليه فرق الذكاء الاصطناعي
Cloudzy.

استدلال LLM من API

شغّل نماذج LLM المضغوطة من فئة 7B–70B خلف نقطة نهاية متوافقة مع OpenAI. vLLM أو TGI على GPU، وllama.cpp / Ollama على CPU القوية. احسب فواتير عملائك بالرمز المميز.

خلفيات RAG

Postgres مع pgvector أو Qdrant على VPS من نوع CPU، مع خيار إضافة صندوق GPU للتضمين والتوليد. NVMe يجعل عمليات البحث في المتجهات سريعة دائماً.

بيئات تشغيل الوكلاء

وكلاء LangChain أو LlamaIndex طويلة الأمد تستدعي APIs من OpenAI/Anthropic وبياناتك الخاصة. IP ثابت يُبقي استدعاء الأدوات مستقراً.

توليد الصور والفيديو

Stable Diffusion وSDXL وComfyUI ونماذج الفيديو على GPUs من فئة RTX. NVMe يتيح لك تبديل النماذج في ثوانٍ لا دقائق.

الضبط الدقيق والتدريب

الضبط الدقيق بـLoRA / QLoRA على فئة RTX، والتدريب الكامل للمعاملات على GPUs من فئة مراكز البيانات. CUDA وNCCL وPyTorch مثبّتة مسبقاً.

عمال التضمين

شغّل عامل sentence-transformers على VPS من نوع CPU بحجم 16–32 GB لتضمين ملايين المستندات دون دفع أسعار SaaS لكل طلب.

60s
التهيئة
40 Gbps
ربط صاعد
NVMe فقط
التخزين
12
المناطق
99.95%
وقت التشغيل SLA
١٤ يومًا
استرداد المبالغ

شبكة عالمية

١٢ منطقة. أربع قارات.
زمن الاستجابة في الاستدلال، محلول.

ضع API الذكاء الاصطناعي قريباً من عملائك. اجمع بوابة CPU في منطقة مع صندوق GPU في منطقة أخرى.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

خطط CPU للذكاء الاصطناعي

نماذج LLM المضغوطة · RAG · التضمينات. CPU كافية.

كثير من أعباء عمل الذكاء الاصطناعي مرتبطة بـCPU. فوترة بالساعة · خصم ٥٠٪ على جميع الخطط · خطط GPU مدرجة بشكل منفصل في /pricing.

12 GB DDR5

RAG backend · قاعدة بيانات متجهية · embeddings

$34.98 /شهر
$69.95/mo −50%
انشر الآن
ضمان استرداد المال لمدة 14 يومًا
  • 4 vCPU @ EPYC
  • 300 GB NVMe
  • 8 TB · 40 Gbps
  • Ollama / vLLM CPU
  • جذر SSH · KVM
16 GB DDR5

استدلال CPU متوسط الحجم · بوابة API

$49.98 /شهر
$99.95/mo −50%
انشر الآن
ضمان استرداد المال لمدة 14 يومًا
  • 8 vCPU @ EPYC
  • 350 GB NVMe
  • 10 TB · 40 Gbps
  • Ollama / vLLM CPU
  • جذر SSH · KVM

الأسئلة الشائعة. خادم AI VPS

أسئلة شائعة، إجابات مباشرة.

ما هو AI VPS؟

AI VPS هو خادم سحابي Linux مُعدّ خصيصاً لأعباء عمل AI، بنوى RAM وEPYC عالية الأداء لاستدلال CPU وRAG، أو GPUs من فئة NVIDIA للتدريب وتشغيل النماذج الكبيرة. تسجّل الدخول، وتثبّت بيئتك، وتبدأ العمل فوراً. نفس VPS، بأشكال مختلفة لمتطلبات مختلفة.

هل أحتاج إلى GPU، أم يكفي CPU؟

يعتمد الأمر على النموذج. النماذج LLM المضغوطة من فئة 7B (int4 / int8 عبر llama.cpp أو Ollama) تعمل بشكل جيد على خطة CPU بسعة 16–32 GB. نماذج Embedding وقواعد البيانات المتجهية (Qdrant, Weaviate, pgvector) وRAG pipelines تعتمد أساساً على CPU. أما للتدريب، أو تشغيل نماذج أكبر، أو أي شيء كثيف الإنتاجية، فخطة GPU هي الخيار الأنسب.

هل يمكنني تشغيل API للاستدلال خلف موازن أحمال؟

نعم. شغّل vLLM أو TGI أو خدمة FastAPI الخاصة بك على خادم GPU، ثم ضع VPS صغيراً من نوع CPU أمامه ليعمل بوابةً لـAPI ومحدّداً لمعدل الطلبات. يتشاركان شبكة خاصة في نفس المنطقة. سرعة 40 Gbps تضمن ألا تكون البوابة عنق زجاجة.

هل يمكنني استضافة RAG backend؟

نعم، وهو أحد أكثر الأشكال شيوعاً. VPS من نوع CPU بسعة 16–32 GB يشغّل Postgres مع pgvector أو Qdrant بتكلفة منخفضة، ثم تستدعي VPS من نوع GPU أو LLM مستضافاً لمرحلة التوليد. NVMe يجعل استعلامات المتجهات سريعة، وEPYC يتولى حساب الـembedding عند المعالجة الدفعية.

ما أطر عمل AI المدعومة؟

جميعها. PyTorch، TensorFlow، JAX، ONNX، llama.cpp، Ollama، vLLM، TGI، sglang، MLX (على الأجهزة المناسبة)، Hugging Face Transformers، تثبّتها عبر conda أو pip أو Docker. صور CUDA جاهزة مسبقاً على خطط GPU، وصلاحية root كاملة على كل الخطط.

هل تكون GPUs مشتركة؟

لا. خطط GPU تستخدم PCI passthrough، فالـGPU الذي تحجزه مخصّص بالكامل لجهازك الافتراضي، بكامل الذاكرة وكامل سرعة المعالج. CUDA وNVENC وNCCL تعمل تماماً كما على خادم bare-metal. فئة RTX للاستدلال بتكلفة فعّالة، والفئة Datacenter للتدريب المتقدم.

كم أحتاج من VRAM؟

8 GB for SDXL or 7B-class LLMs at int4. 24 GB for 13B at fp16 or 70B at int4. 40+ GB for fp16 70B and full-precision training. Match the GPU plan to your model size, quantization changes the math, so test before committing to a tier.

هل تتوفر ضمانة استرداد الأموال؟

نعم، ١٤ يوماً من تاريخ الشراء، استرداد كامل دون أسئلة. أجرِ اختبار زمن الاستجابة الفعلي لنظام الاستدلال لديك، وشغّل معيار RAG الخاص بك، ثم قرّر ما إذا كان Cloudzy مناسباً لك قبل الالتزام بعقد سنوي.

ما سرعة التجهيز؟

بمجرد تأكيد الدفع، يكون AI VPS الخاص بك جاهزاً خلال ٦٠ ثانية. CPU أو GPU. الصور المُعدّة مسبقاً بـCUDA على خطط GPU تجعل `nvidia-smi` يستجيب في ثوانٍ. خطط CPU تأتي مع Ubuntu LTS أو Debian، وتثبّت بيئة AI الخاصة بك عبر conda أو pip في دقائق.

هل يمكنني استخدامه في بيئة الإنتاج؟

نعم. ضمان وقت تشغيل ٩٩٫٩٥٪ SLA، فوترة بالساعة، بدون التزامات، عناوين IP مخصصة، وإمكانية توسيع RAM/vCPU/التخزين مباشرةً دون إعادة بناء. كثير من عملائنا يشغّلون استدلال AI وAPIs من نوع RAG في الإنتاج من خلال Cloudzy.

جاهزون متى كنت مستعداً.
AI VPS خلال ٦٠ ثانية.

اختر المواصفات التي يحتاجها حملك. CPU للاستدلال وRAG؛ GPU للتدريب. لوحة تحكم واحدة.

لا حاجة لبطاقة ائتمان · ضمان استرداد المبلغ خلال ١٤ يومًا · إلغاء في أي وقت