diskon 50% semua paket, waktu terbatas. Mulai dari $2.48/mo

Hosting VPS GPU

RTX 6000 Pro. A100. RTX 5090.
Dedicated, bukan berbagi.

Passthrough GPU penuh. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN, dan PyTorch sudah terinstal.
Storage NVMe + jaringan 40 Gbps. Cloud independen sejak 2008.

4.6 · 728 reviews on Trustpilot

Dimulai dari $506.35/mo · Diskon 35% untuk tahunan · Tidak perlu kartu kredit

~ ssh root@gpu-train-001 terhubung
root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

VPS GPU sekilas

Cloudzy menjual paket VPS GPU dengan dedicated RTX 6000 Pro, A100 Nvidia, RTX 5090, dan RTX 4090 kartu di 1× hingga 4× konfigurasi, mulai dari $506.35 per month. Setiap paket sudah dilengkapi dengan CUDA, cuDNN, dan driver Nvidia terbaru, berjalan di AMD EPYC + DDR5 dengan NVMe saja penyimpanan dan 40 Gbps uplink, dan siap digunakan dalam 60 detik. GPU bersifat dedicated passthrough, bukan vGPU, bukan MIG, bukan shared. Cloudzy beroperasi secara independen sejak 2008 dan mendapat rating 4.6 / 5 by 728+ reviewers di Trustpilot.

Harga mulai
$506.35 / mo
Jenis GPU
6000 Pro · A100 · 5090 · 4090
Konfigurasi
1× hingga 4×
CUDA
Pra-dipasang
Diskon tahunan
Diskon 35%
Uang kembali
14 hari

Mengapa tim ML memilih Cloudzy

Komputasi GPU yang cara yang tidak membosankan.

Empat alasan tim beralih ke Cloudzy dari AWS / GCP / GPU hyperscaler.

Passthrough GPU dedicated

Kartu fisik sepenuhnya milik Anda, tanpa pembagian vGPU, tanpa partisi MIG, tanpa berbagi dengan tenant lain. CUDA core, VRAM, PCIe lane, semuanya dedicated.

Image siap pakai untuk CUDA

Driver Nvidia terbaru, CUDA toolkit, dan cuDNN sudah terpasang di image Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install dan training bisa langsung dimulai.

NVMe + 40 Gbps

Storage NVMe murni agar loading dataset tidak jadi hambatan. Jaringan 40 Gbps memungkinkan pengunduhan model Hugging Face berukuran 100 GB selesai dalam hitungan detik, bukan menit.

Dukungan manusia 24/7

Engineer sungguhan di chat. Kami sudah membantu banyak tim menyiapkan training multi-GPU, men-debug CUDA OOM, dan menyetel inferensi Llama — jawabannya datang cepat.

lineup GPU

Empat keluarga.
Sembilan cara untuk scale.

RTX 6000 Pro untuk inferensi dan rendering kelas profesional dengan ECC VRAM 48 GB. A100 untuk training dan workload VRAM besar. RTX 5090 untuk inferensi terbaru. RTX 4090 untuk inferensi hemat biaya hingga 70B (4-bit). Paket multi-GPU tersedia, pilih sesuai anggaran VRAM yang kamu butuhkan.

GPU penuh tanpa slicing, tanpa shared
RTX 6000 Pro
48 GB GDDR6 ECC · Pro-grade
Nvidia A100
80 GB HBM2e · ML training
RTX 5090
32 GB GDDR7 · Blackwell
RTX 4090
24 GB GDDR6X · cost-effective
1× hingga 4× GPU
Paket multi-GPU tersedia
CUDA pra-instal
PyTorch · TF · JAX siap
Murni NVMe
Dataset I/O cepat
40 Gbps uplink
Tarik model 100 GB dalam 30 detik

Kasus penggunaan

Workload yang benar-benar dijalankan
pelanggan kami.

Inferensi LLM

Sajikan Llama 3, Mistral, DeepSeek, atau Qwen dengan vLLM atau Text Generation Inference. RTX 4090 menangani 70B di 4-bit, RTX 5090 menangani 70B di 8-bit, A100 menangani tanpa kuantisasi.

Stable Diffusion · pembangkit gambar

Jalankan SDXL, Flux, atau checkpoint Stable Diffusion yang sudah di-fine-tune dengan ComfyUI atau Automatic1111. RTX 4090 menghasilkan 30+ gambar/menit pada SDXL 1024×1024 standar.

Training ML + fine-tuning

LoRA, QLoRA, full fine-tuning. A100 adalah pilihan terbaik untuk fine-tuning 7B-13B tanpa kuantisasi; 4× A100 menangani hingga 70B dengan sharding yang tepat (FSDP / DeepSpeed).

Rendering 3D · Blender

Cycles + OptiX di kartu RTX adalah jalur tercepat untuk studio animasi. VRAM 24 GB pada RTX 4090 mencukupi sebagian besar scene produksi single-frame.

Pipeline speech + vision

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Bahkan paket RTX 4090 mampu menjalankan inferensi real-time pada model-model ini dengan headroom yang nyaman.

Batch job jangka panjang

Pembuatan embedding, pipeline retrieval, preprocessing dataset. Bayar per jam, jalankan job-nya, snapshot hasilnya, hapus server, lebih murah dibanding menyewa di AWS/GCP untuk workload yang sama.

80 GB
A100 VRAM
40 Gbps
Tautan naik
CUDA-siap
Gambar
4 ×
GPU Maksimal
35%
Diskon tahunan
14 hari
Uang kembali

Harga

Paket GPU unggulan. Jam-jaman atau tahunan.

Tagihan tahunan saat ini Diskon 35% untuk setiap paket GPU.

Pertanyaan Umum. GPU VPS

Pertanyaan umum jawaban langsung.

GPU apa saja yang ditawarkan Cloudzy?

Empat keluarga: RTX 6000 Pro (1×, VRAM GDDR6 ECC 48 GB, kelas profesional untuk inferensi dan rendering), Nvidia A100 (1× / 2× / 4×, untuk training ML, workload fp16/bf16, dan HBM2e 80 GB per kartu), RTX 5090 (1× / 2×, arsitektur Blackwell terbaru, ideal untuk inferensi dan rendering), dan RTX 4090 (1× / 2× / 4×, hemat biaya untuk Stable Diffusion, inferensi LLM, dan rendering 3D).

Apakah GPU yang tersedia bersifat dedicated atau shared?

Dedicated. Setiap paket memberikan akses penuh langsung ke GPU fisik, bukan sebagian, bukan vGPU, bukan MIG. CUDA core, RAM, bandwidth PCIe — semuanya milik Anda. Paket multi-GPU menggunakan NVLink jika hardware fisiknya mendukung (paket multi-GPU A100).

Apakah CUDA sudah terpasang?

Ya. Setiap VPS GPU sudah dilengkapi CUDA toolkit stabil terbaru, cuDNN, dan driver Nvidia yang telah terpasang dalam image Ubuntu. PyTorch, TensorFlow, JAX, dan stack Hugging Face siap digunakan langsung. Anda bisa re-image ke Ubuntu bersih tanpa CUDA jika ingin memasang versi tertentu.

Berapa besar RAM yang saya dapatkan?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Paket multi-GPU menjumlahkan semuanya — paket 4× A100 memiliki total 320 GB RAM. Daftar paket di atas menampilkan RAM sistem secara terpisah.

Bisakah saya menjalankan Stable Diffusion / Llama / Whisper di VPS GPU?

Bisa. Paket 1× RTX 4090 adalah titik awal yang tepat: RAM-nya cukup untuk inferensi SDXL, Llama 3 70B (kuantisasi 4-bit), atau Whisper Large. Pilih RTX 5090 atau A100 jika Anda perlu menjalankan model 70B tanpa kuantisasi atau melatih LoRA.

Bagaimana harganya dibandingkan AWS / Google Cloud / Lambda Labs?

Umumnya lebih murah untuk beban kerja tetap. Kami tidak membedakan harga antara 'on-demand' dan 'spot', dan tidak ada biaya egress. Kami tidak akan menyebut angka kompetitor karena harga mereka berubah setiap bulan. Garansi uang kembali 14 hari memungkinkan Anda membandingkan dengan provider saat ini menggunakan benchmark Anda sendiri.

Apakah ada diskon tahunan?

Ya, diskon 35% untuk tagihan tahunan di setiap paket GPU (lebih rendah dari diskon 50% pada CPU biasa karena biaya hardware GPU lebih tinggi untuk diamortisasi). Tidak ada perpanjangan otomatis — Anda akan menerima invoice sebelum setiap siklus tahunan sehingga bisa downgrade, upgrade, atau batal tanpa biaya tak terduga.

Bagaimana dengan jaringan? Apakah benar-benar 40 Gbps?

Ya. Uplink 40 Gbps yang sama dengan Cloud VPS unggulan kami, tanpa biaya egress untuk transfer bulanan hingga batas paket. Berguna untuk memindahkan dataset besar ke dan dari node GPU — mengunduh model Hugging Face sebesar 100 GB hanya butuh sekitar 30 detik pada kecepatan penuh.

Bisakah saya menjalankan pelatihan multi-node (beberapa VPS GPU sekaligus)?

Bisa, dalam satu region. VPS di datacenter yang sama berbagi jaringan lokal dengan latensi di bawah satu milidetik. Kami saat ini tidak menyediakan interkoneksi InfiniBand — pelatihan multi-node melalui Ethernet standar cocok untuk fine-tuning dan pekerjaan terdistribusi skala kecil, tetapi tidak sebanding dengan HPC bare-metal untuk pre-training skala besar.

Apakah ada garansi uang kembali untuk paket GPU?

14 hari, tanpa pertanyaan. Pengembalian dana dalam satu siklus tagihan. Cukup waktu untuk mengukur throughput CUDA, menjalankan langkah pelatihan nyata, dan memutuskan apakah Cloudzy cocok untuk beban kerja Anda.

Berhenti membayar harga hyperscaler.
Latih model di GPU dedicated.

Pilih kartu, pilih region, klik. CUDA sudah terpasang.

Tidak perlu kartu kredit · Garansi uang kembali 14 hari · Batalkan kapan saja