Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

استضافة GPU VPS

RTX 6000 Pro. A100. RTX 5090.
مخصص بالكامل، لا مقسّم.

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

تمرير كامل لـ GPU. وصول مباشر إلى CPU، RAM، NVMe، SSD. CUDA وcuDNN وDocker مثبتة مسبقاً.
NVMe + شبكة بسرعة 40 Gbps. مزود سحابي مستقل منذ عام ٢٠٠٨.

4.6 · 728 reviews on Trustpilot

نشر GPU VPS مقارنة خطط GPU

يبدأ من $506.35/mo · خصم 35% على الاشتراك السنوي · لا حاجة لبطاقة ائتمان

~ ssh root@gpu-train-001 متصل

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS في لمحة سريعة

Cloudzy تبيع خطط GPU VPS بموارد مخصصة RTX 6000 Pro, Nvidia A100, RTX 5090, و RTX 4090 البطاقات في من ١× إلى ٤× تكوينات، تبدأ من $506.35 per month. كل خطة تأتي مثبَّتاً عليها أحدث CUDA, cuDNN, وبرامج تشغيل Nvidia، يعمل على AMD EPYC + DDR5 مع NVMe فقط خالص و 40 Gbps الروابط الصاعدة، ويتم التوفير في ٦٠ ثانيةوحدات GPUs مخصصة بالكامل عبر تقنية Passthrough، وليست GPU افتراضية، ولا MIG، ولا مشتركة. تعمل Cloudzy باستقلالية منذ 2008 وتحمل تقييم 4.6 / 5 by 728+ reviewers على Trustpilot.

سعر البداية: $506.35 / mo
أنواع GPU: 6000 Pro · A100 · 5090 · 4090
الإعدادات: من ١× إلى ٤×
CUDA: مثبّت مسبقاً
خصم سنوي: خصم ٣٥٪
استرداد المبالغ: ١٤ يومًا

لماذا تختار فرق ML نظام Cloudzy

قوة حوسبة GPU بأسلوب لا يُمل.

الأسباب الأربعة التي تدفع الفرق إلى الانتقال إلى Cloudzy من AWS / GCP / GPU الكبيرة.

تمرير GPU المخصص

البطاقة الفيزيائية الكاملة لك وحدك، دون تقسيم أو تجزئة MIG، ودون مشاركة مع مستخدمين آخرين. أنوية CUDA، وVRAM، ومسارات PCIe، كلها مخصصة لك.

صور جاهزة لـ CUDA

أحدث إصدارات درايفرات Nvidia، وأدوات CUDA toolkit، وcuDNN مدمجة مسبقاً في صورة Ubuntu. PyTorch، TensorFlow، JAX، Hugging Face، ثم pip install وتبدأ التدريب فوراً.

NVMe + 40 Gbps

تخزين NVMe بحت حتى لا يكون تحميل مجموعات البيانات عائقاً. شبكة بسرعة 40 Gbps تعني أن تنزيل نموذج Hugging Face بحجم 100 GB يكتمل في ثوانٍ، لا دقائق.

دعم بشري على مدار الساعة

مهندسون حقيقيون على المحادثة. ساعدنا فرقاً كثيرة في إعداد بيئات التدريب متعددة GPU، وتشخيص أخطاء CUDA OOMs، وضبط استنتاج Llama، حتى باتت الإجابات تصلك سريعاً.

تشكيلة GPU

أربع فئات.
تسعة أساليب للتوسع.

RTX 6000 Pro للاستدلال والعرض الاحترافي مع ذاكرة ECC VRAM سعتها ٤٨ GB. A100 لمهام التدريب وأحمال عمل VRAM الكبيرة. RTX 5090 لأحدث متطلبات الاستدلال. RTX 4090 للاستدلال الاقتصادي حتى ٧٠B (٤-bit). تتوفر خطط Multi-GPU، اختر ما يناسب ميزانية VRAM لديك.

تمرير GPU كامل — دون تقسيم أو مشاركة

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

من ١× إلى ٤× GPU

خطط متعددة لـ Multi-GPU متاحة

CUDA مثبَّت مسبقاً

PyTorch · TF · JAX جاهز

NVMe نقي

مجموعة بيانات سريعة I/O

40 Gbps uplink

تحميل نماذج بحجم ١٠٠ GB في ٣٠ ثانية

حالات الاستخدام

أعباء العمل التي يديرها عملاؤنا
عملاء يتدربون فعلاً.

استنتاج LLM

قدِّم Llama 3 أو Mistral أو DeepSeek أو Qwen باستخدام vLLM أو Text Generation Inference. RTX 4090 يعالج نماذج 70B بدقة 4-bit، وRTX 5090 يعالجها بدقة 8-bit، أما A100 فيعمل مع النماذج غير المضغوطة.

Stable Diffusion · توليد الصور

شغِّل نقاط تفتيش SDXL أو Flux أو Stable Diffusion المُعدَّلة باستخدام ComfyUI أو Automatic1111. RTX 4090 يُنتج أكثر من 30 صورة/دقيقة بدقة 1024×1024 لـ SDXL.

تدريب ML وضبط دقيق

LoRA وQLoRA والضبط الدقيق الكامل. A100 هو الخيار الأمثل للضبط الدقيق غير المضغوط لنماذج 7B-13B؛ و4× A100 يستوعب ما يصل إلى 70B مع التجزئة الصحيحة (FSDP / DeepSpeed).

التصيير ثلاثي الأبعاد · Blender

Cycles + OptiX على بطاقات RTX هو أسرع مسار لاستوديوهات الرسوم المتحركة. ذاكرة VRAM البالغة 24 GB في RTX 4090 تغطي الغالبية العظمى من مشاهد الإنتاج أحادية الإطار.

معالجة الصوت والرؤية الحاسوبية

Whisper Large وFaster-Whisper وYOLO وSegment Anything. حتى خطة RTX 4090 تُشغِّل الاستدلال الفوري على هذه النماذج مع هامش أداء مريح.

المهام الدُّفعية طويلة الأمد

توليد التضمينات، وخطوط الاسترجاع، ومعالجة مجموعات البيانات. ادفع بالساعة، نفِّذ المهمة، احفظ نسخة من المخرجات، ثم احذف الخادم. أرخص من الاستئجار على AWS/GCP لنفس حجم العمل.

80 GB

A100 VRAM

40 Gbps

ربط صاعد

جاهز لـ CUDA

الصورة

4 ×

الحد الأقصى لـ GPU

35%

خصم سنوي

١٤ يومًا

استرداد المبالغ

الأسعار

خطط GPU المميزة. بالساعة أو بالسنة.

الفوترة السنوية متاحة حالياً خصم ٣٥٪ على جميع خطط GPU.

الأكثر شيوعاً

1× RTX 6000 Pro

48 GB GDDR6 ECC VRAM

$845 /شهر

$1300/mo -35%

انشر الآن

ضمان استرداد المال لمدة 14 يومًا

200 GB DDR5
24 vCPU
1.3 TB NVMe NVMe
20 TB · 40 Gbps
CUDA مثبَّت مسبقاً

عرض جميع خطط GPU التسع (من ١× إلى ٤× بطاقات)

الأسئلة الشائعة. GPU VPS

أسئلة شائعة، إجابات مباشرة.

ما هي بطاقات GPU التي تقدمها Cloudzy؟

أربع فئات: RTX 6000 Pro (١×، ٤٨ GB GDDR6 ECC VRAM، مستوى احترافي للاستدلال والتصيير)، وNvidia A100 (١× / ٢× / ٤×، مخصصة لتدريب ML وأحمال عمل fp16/bf16، مع ٨٠ GB HBM2e لكل بطاقة)، وRTX 5090 (١× / ٢×، بنية Blackwell الحديثة، مثالية لأحمال الاستدلال والتصيير)، وRTX 4090 (١× / ٢× / ٤×، خيار اقتصادي لـStable Diffusion واستدلال LLM والتصيير ثلاثي الأبعاد).

هل بطاقات GPU مخصصة أم مشتركة؟

مخصصة بالكامل. كل خطة تمنحك وصولاً مباشراً إلى بطاقة GPU الفيزيائية الكاملة، لا شريحة منها، ولا vGPU، ولا MIG. نوى CUDA وذاكرة VRAM وعرض نطاق PCIe، كلها لك وحدك. الخطط متعددة البطاقات تستخدم NVLink عندما تدعمها العتاد الفيزيائي (خطط A100 متعددة البطاقات).

هل CUDA مثبتة مسبقاً؟

نعم. كل VPS مزوّد بـGPU يأتي مع أحدث إصدار مستقر من مجموعة أدوات CUDA وcuDNN وتعريفات Nvidia مدمجة في صورة Ubuntu. PyTorch وTensorFlow وJAX ومنظومة Hugging Face جاهزة للاستخدام فور التشغيل. يمكنك إعادة تهيئة الخادم بصورة Ubuntu نظيفة بدون CUDA إن أردت تثبيت إصدار بعينه.

كم تبلغ سعة VRAM التي أحصل عليها؟

لكل بطاقة GPU: RTX 6000 Pro = ٤٨ GB GDDR6 ECC، وA100 = ٨٠ GB HBM2e، وRTX 5090 = ٣٢ GB GDDR7، وRTX 4090 = ٢٤ GB GDDR6X. في الخطط متعددة البطاقات تتجمع هذه السعات؛ فخطة ٤× A100 توفر ٣٢٠ GB إجمالياً من VRAM. قائمة الخطط أعلاه تعرض ذاكرة RAM النظامية بشكل منفصل.

هل يمكنني تشغيل Stable Diffusion / Llama / Whisper على VPS مزوّد بـGPU؟

نعم. خطة ١× RTX 4090 نقطة انطلاق جيدة: توفر سعة VRAM كافية لاستدلال SDXL، أو نموذج Llama 3 70B (مضغوط بـ٤ بت)، أو Whisper Large. انتقل إلى RTX 5090 أو A100 إن احتجت تشغيل نماذج 70B دون ضغط أو تدريب LoRAs.

كيف تقارن الأسعار بـAWS / Google Cloud / Lambda Labs؟

الأسعار أقل في العموم لأحمال العمل الثابتة؛ لا نميّز في التسعير بين 'الطلب الفوري' و'الموارد الاحتياطية'، ولا نفرض رسوم نقل بيانات خارجية. لن نستشهد بأرقام المنافسين لأنها تتغير شهرياً. ضمان استرداد المبلغ خلال ١٤ يوماً يتيح لك المقارنة المباشرة مع مزودك الحالي باستخدام معاييرك الخاصة.

هل يوجد خصم للاشتراك السنوي؟

نعم، خصم ٣٥٪ على الفوترة السنوية لجميع خطط GPU (أقل من خصم ٥٠٪ المتاح على CPU العادية، نظراً لتكاليف استهلاك عتاد GPU الأعلى). لا تجديد تلقائي؛ ستصلك فاتورة قبل كل دورة سنوية حتى تتمكن من التخفيض أو الترقية أو الإلغاء دون رسوم مفاجئة.

ماذا عن الشبكة؟ هل السرعة ٤٠ Gbps فعلاً؟

نعم. نفس روابط ٤٠ Gbps المستخدمة في خوادمنا السحابية الرئيسية VPS، دون رسوم نقل بيانات خارجية ضمن الحصة الشهرية المحددة في الخطة. هذا مفيد جداً لنقل مجموعات البيانات الكبيرة من وإلى عقدة GPU؛ تنزيل نموذج Hugging Face بحجم ١٠٠ GB لا يستغرق سوى نحو ٣٠ ثانية بالسرعة القصوى.

هل يمكنني إجراء تدريب متعدد العقد (عدة خوادم VPS مزوّدة بـGPU معاً)؟

نعم، داخل المنطقة الجغرافية الواحدة. تتشارك VPS في مركز البيانات نفسه شبكةً محليةً بزمن استجابة أقل من ميلي ثانية. لا ندعم حاليًا InfiniBand، لكن التدريب الموزع عبر Ethernet القياسي مناسب تمامًا للضبط الدقيق والمهام الموزعة الصغيرة، وإن كان لا يضاهي أنظمة HPC المعدنية المجردة في التدريب المسبق الضخم.

هل تتوفر ضمانة استرداد الأموال لخطط GPU؟

١٤ يومًا دون أي أسئلة. يُعاد المبلغ خلال دورة الفوترة الواحدة. وقت كافٍ لاختبار معدل نقل CUDA، وتشغيل خطوة تدريب فعلية، والتأكد من أن Cloudzy يلائم عبء عملك.

توقف عن الدفع بأسعار الموفرين الكبار.
درِّب على GPU مخصصة.

اختر البطاقة، اختر المنطقة، اضغط. CUDA مثبت مسبقًا.