Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

Hosting VPS GPU

RTX 6000 Pro. A100. RTX 5090.
Dedicated, bukan berbagi.

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

Passthrough GPU penuh. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN, dan PyTorch sudah terinstal.
Storage NVMe + jaringan 40 Gbps. Cloud independen sejak 2008.

4.6 · 728 reviews on Trustpilot

Deploy VPS GPU Bandingkan paket GPU

Dimulai dari $506.35/mo · Diskon 35% untuk tahunan · Tidak perlu kartu kredit

~ ssh root@gpu-train-001 terhubung

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

VPS GPU sekilas

Cloudzy menjual paket VPS GPU dengan dedicated RTX 6000 Pro, A100 Nvidia, RTX 5090, dan RTX 4090 kartu di 1× hingga 4× konfigurasi, mulai dari $506.35 per month. Setiap paket sudah dilengkapi dengan CUDA, cuDNN, dan driver Nvidia terbaru, berjalan di AMD EPYC + DDR5 dengan NVMe saja penyimpanan dan 40 Gbps uplink, dan siap digunakan dalam 60 detik. GPU bersifat dedicated passthrough, bukan vGPU, bukan MIG, bukan shared. Cloudzy beroperasi secara independen sejak 2008 dan mendapat rating 4.6 / 5 by 728+ reviewers di Trustpilot.

Harga mulai: $506.35 / mo
Jenis GPU: 6000 Pro · A100 · 5090 · 4090
Konfigurasi: 1× hingga 4×
CUDA: Pra-dipasang
Diskon tahunan: Diskon 35%
Uang kembali: 14 hari

Mengapa tim ML memilih Cloudzy

Komputasi GPU yang cara yang tidak membosankan.

Empat alasan tim beralih ke Cloudzy dari AWS / GCP / GPU hyperscaler.

Passthrough GPU dedicated

Kartu fisik sepenuhnya milik Anda, tanpa pembagian vGPU, tanpa partisi MIG, tanpa berbagi dengan tenant lain. CUDA core, VRAM, PCIe lane, semuanya dedicated.

Image siap pakai untuk CUDA

Driver Nvidia terbaru, CUDA toolkit, dan cuDNN sudah terpasang di image Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install dan training bisa langsung dimulai.

NVMe + 40 Gbps

Storage NVMe murni agar loading dataset tidak jadi hambatan. Jaringan 40 Gbps memungkinkan pengunduhan model Hugging Face berukuran 100 GB selesai dalam hitungan detik, bukan menit.

Dukungan manusia 24/7

Engineer sungguhan di chat. Kami sudah membantu banyak tim menyiapkan training multi-GPU, men-debug CUDA OOM, dan menyetel inferensi Llama — jawabannya datang cepat.

lineup GPU

Empat keluarga.
Sembilan cara untuk scale.

RTX 6000 Pro untuk inferensi dan rendering kelas profesional dengan ECC VRAM 48 GB. A100 untuk training dan workload VRAM besar. RTX 5090 untuk inferensi terbaru. RTX 4090 untuk inferensi hemat biaya hingga 70B (4-bit). Paket multi-GPU tersedia, pilih sesuai anggaran VRAM yang kamu butuhkan.

GPU penuh tanpa slicing, tanpa shared

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

1× hingga 4× GPU

Paket multi-GPU tersedia

CUDA pra-instal

PyTorch · TF · JAX siap

Murni NVMe

Dataset I/O cepat

40 Gbps uplink

Tarik model 100 GB dalam 30 detik

Kasus penggunaan

Workload yang benar-benar dijalankan
pelanggan kami.

Inferensi LLM

Sajikan Llama 3, Mistral, DeepSeek, atau Qwen dengan vLLM atau Text Generation Inference. RTX 4090 menangani 70B di 4-bit, RTX 5090 menangani 70B di 8-bit, A100 menangani tanpa kuantisasi.

Stable Diffusion · pembangkit gambar

Jalankan SDXL, Flux, atau checkpoint Stable Diffusion yang sudah di-fine-tune dengan ComfyUI atau Automatic1111. RTX 4090 menghasilkan 30+ gambar/menit pada SDXL 1024×1024 standar.

Training ML + fine-tuning

LoRA, QLoRA, full fine-tuning. A100 adalah pilihan terbaik untuk fine-tuning 7B-13B tanpa kuantisasi; 4× A100 menangani hingga 70B dengan sharding yang tepat (FSDP / DeepSpeed).

Rendering 3D · Blender

Cycles + OptiX di kartu RTX adalah jalur tercepat untuk studio animasi. VRAM 24 GB pada RTX 4090 mencukupi sebagian besar scene produksi single-frame.

Pipeline speech + vision

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Bahkan paket RTX 4090 mampu menjalankan inferensi real-time pada model-model ini dengan headroom yang nyaman.

Batch job jangka panjang

Pembuatan embedding, pipeline retrieval, preprocessing dataset. Bayar per jam, jalankan job-nya, snapshot hasilnya, hapus server, lebih murah dibanding menyewa di AWS/GCP untuk workload yang sama.

80 GB

A100 VRAM

40 Gbps

Tautan naik

CUDA-siap

Gambar

4 ×

GPU Maksimal

35%

Diskon tahunan

14 hari

Uang kembali

Harga

Paket GPU unggulan. Jam-jaman atau tahunan.

Tagihan tahunan saat ini Diskon 35% untuk setiap paket GPU.

Paling populer

1× RTX 6000 Pro

48 GB GDDR6 ECC VRAM

$845 /bln

$1300/mo -35%

Terapkan sekarang

Uang kembali 14 hari

200 GB DDR5
24 vCPU
1.3 TB NVMe NVMe
20 TB · 40 Gbps
CUDA pra-instal

Lihat semua 9 paket GPU (1× hingga 4× kartu)

Pertanyaan Umum. GPU VPS

Pertanyaan umum jawaban langsung.

GPU apa saja yang ditawarkan Cloudzy?

Empat keluarga: RTX 6000 Pro (1×, VRAM GDDR6 ECC 48 GB, kelas profesional untuk inferensi dan rendering), Nvidia A100 (1× / 2× / 4×, untuk training ML, workload fp16/bf16, dan HBM2e 80 GB per kartu), RTX 5090 (1× / 2×, arsitektur Blackwell terbaru, ideal untuk inferensi dan rendering), dan RTX 4090 (1× / 2× / 4×, hemat biaya untuk Stable Diffusion, inferensi LLM, dan rendering 3D).

Apakah GPU yang tersedia bersifat dedicated atau shared?

Dedicated. Setiap paket memberikan akses penuh langsung ke GPU fisik, bukan sebagian, bukan vGPU, bukan MIG. CUDA core, RAM, bandwidth PCIe — semuanya milik Anda. Paket multi-GPU menggunakan NVLink jika hardware fisiknya mendukung (paket multi-GPU A100).

Apakah CUDA sudah terpasang?

Ya. Setiap VPS GPU sudah dilengkapi CUDA toolkit stabil terbaru, cuDNN, dan driver Nvidia yang telah terpasang dalam image Ubuntu. PyTorch, TensorFlow, JAX, dan stack Hugging Face siap digunakan langsung. Anda bisa re-image ke Ubuntu bersih tanpa CUDA jika ingin memasang versi tertentu.

Berapa besar RAM yang saya dapatkan?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Paket multi-GPU menjumlahkan semuanya — paket 4× A100 memiliki total 320 GB RAM. Daftar paket di atas menampilkan RAM sistem secara terpisah.

Bisakah saya menjalankan Stable Diffusion / Llama / Whisper di VPS GPU?

Bisa. Paket 1× RTX 4090 adalah titik awal yang tepat: RAM-nya cukup untuk inferensi SDXL, Llama 3 70B (kuantisasi 4-bit), atau Whisper Large. Pilih RTX 5090 atau A100 jika Anda perlu menjalankan model 70B tanpa kuantisasi atau melatih LoRA.

Bagaimana harganya dibandingkan AWS / Google Cloud / Lambda Labs?

Umumnya lebih murah untuk beban kerja tetap. Kami tidak membedakan harga antara 'on-demand' dan 'spot', dan tidak ada biaya egress. Kami tidak akan menyebut angka kompetitor karena harga mereka berubah setiap bulan. Garansi uang kembali 14 hari memungkinkan Anda membandingkan dengan provider saat ini menggunakan benchmark Anda sendiri.

Apakah ada diskon tahunan?

Ya, diskon 35% untuk tagihan tahunan di setiap paket GPU (lebih rendah dari diskon 50% pada CPU biasa karena biaya hardware GPU lebih tinggi untuk diamortisasi). Tidak ada perpanjangan otomatis — Anda akan menerima invoice sebelum setiap siklus tahunan sehingga bisa downgrade, upgrade, atau batal tanpa biaya tak terduga.

Bagaimana dengan jaringan? Apakah benar-benar 40 Gbps?

Ya. Uplink 40 Gbps yang sama dengan Cloud VPS unggulan kami, tanpa biaya egress untuk transfer bulanan hingga batas paket. Berguna untuk memindahkan dataset besar ke dan dari node GPU — mengunduh model Hugging Face sebesar 100 GB hanya butuh sekitar 30 detik pada kecepatan penuh.

Bisakah saya menjalankan pelatihan multi-node (beberapa VPS GPU sekaligus)?

Bisa, dalam satu region. VPS di datacenter yang sama berbagi jaringan lokal dengan latensi di bawah satu milidetik. Kami saat ini tidak menyediakan interkoneksi InfiniBand — pelatihan multi-node melalui Ethernet standar cocok untuk fine-tuning dan pekerjaan terdistribusi skala kecil, tetapi tidak sebanding dengan HPC bare-metal untuk pre-training skala besar.

Apakah ada garansi uang kembali untuk paket GPU?

14 hari, tanpa pertanyaan. Pengembalian dana dalam satu siklus tagihan. Cukup waktu untuk mengukur throughput CUDA, menjalankan langkah pelatihan nyata, dan memutuskan apakah Cloudzy cocok untuk beban kerja Anda.

Berhenti membayar harga hyperscaler.
Latih model di GPU dedicated.

Pilih kartu, pilih region, klik. CUDA sudah terpasang.