Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

Hosting VPS GPU

RTX 6000 Pro. A100. RTX 5090.
Dedicata, non condivisa.

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

GPU in passthrough completo. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN e PyTorch preinstallati.
NVMe + rete a 40 Gbps. Cloud indipendente dal 2008.

4.6 · 728 reviews on Trustpilot

Avvia un VPS GPU Confronta i piani GPU

A partire da $506.35/mo · 35% di sconto con piano annuale · Nessuna carta di credito richiesta

~ ssh root@gpu-train-001 connesso

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS in breve

Cloudzy vende piani GPU VPS con RTX 6000 Pro, Nvidia A100, RTX 5090, e RTX 4090 carte in da 1× a 4× configurazioni, a partire da $506.35 per month. Ogni piano viene fornito con la versione più recente di CUDA, cuDNN, e driver Nvidia preinstallati, gira su AMD EPYC + DDR5 con Solo NVMe archiviazione e 40 Gbps uplink, ed è pronto in 60 secondi. Le GPU sono passthrough dedicato, non vGPU, non MIG, non condivise. Cloudzy opera in modo indipendente dal 2008 e ha un rating 4.6 / 5 by 728+ reviewers su Trustpilot.

Prezzo di partenza: $506.35 / mo
tipi di GPU: 6000 Pro · A100 · 5090 · 4090
Configurazioni: da 1× a 4×
CUDA: Preinstallato
Sconto annuale: Sconto del 35%
Rimborso del denaro: 14 giorni

Perché i team ML scelgono Cloudzy

Calcolo GPU al in modo non noioso.

I quattro motivi per cui i team passano a Cloudzy da AWS / GCP / GPU degli hyperscaler.

Passthrough GPU dedicato

La scheda fisica è interamente tua: niente slicing vGPU, niente partizioni MIG, niente contesa con altri tenant. CUDA core, VRAM, lane PCIe, tutto dedicato.

Immagini CUDA-ready

Driver Nvidia, CUDA toolkit e cuDNN preinstallati nell'immagine Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install e puoi già addestrare.

NVMe + 40 Gbps

Storage NVMe puro, così il caricamento dei dataset non è mai il collo di bottiglia. Con 40 Gbps di rete, scaricare un modello Hugging Face da 100 GB richiede secondi, non minuti.

Supporto umano 24/7

Ingegneri veri in chat. Abbiamo aiutato abbastanza team a configurare training multi-GPU, diagnosticare CUDA OOM e ottimizzare l'inferenza Llama da rispondere in tempi rapidi.

Gamma di GPU

Quattro famiglie.
Nove opzioni di scalabilità.

RTX 6000 Pro per inferenza e rendering professionali con 48 GB di VRAM ECC. A100 per training e workload con VRAM elevata. RTX 5090 per l'inferenza più recente. RTX 4090 per inferenza economica fino a 70B (4-bit). Piani multi-GPU disponibili: scegli in base al tuo budget di VRAM.

Passthrough GPU completo, non suddiviso, non condiviso

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

da 1× a 4× GPU

Piani multi-GPU disponibili

CUDA preinstallato

PyTorch · TF · JAX pronto

NVMe Puro

Dataset I/O veloce

40 Gbps uplink

Estrai modelli da 100 GB in 30s

Casi d'uso

I workload dei nostri
i clienti allenano davvero.

Inferenza LLM

Servi Llama 3, Mistral, DeepSeek o Qwen con vLLM o Text Generation Inference. RTX 4090 gestisce modelli da 70B a 4-bit, RTX 5090 a 8-bit, A100 senza quantizzazione.

Stable Diffusion · generazione immagini

Esegui checkpoint SDXL, Flux o Stable Diffusion fine-tuned con ComfyUI o Automatic1111. RTX 4090 supera le 30 immagini/min su SDXL standard a 1024×1024.

Training ML e fine-tuning

LoRA, QLoRA, fine-tuning completo. A100 è la scelta ideale per il fine-tuning non quantizzato di modelli 7B-13B; 4× A100 arriva fino a 70B con sharding corretto (FSDP / DeepSpeed).

Rendering 3D · Blender

Cycles e OptiX su schede RTX sono la via più rapida per gli studi di animazione. I 24 GB VRAM di RTX 4090 coprono la grande maggioranza delle scene di produzione a frame singolo.

Pipeline di audio e visione

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Anche il piano RTX 4090 esegue inferenza in tempo reale su questi modelli con ampio margine.

Job batch a lunga esecuzione

Generazione di embedding, pipeline di retrieval, preprocessing dei dataset. Paghi a ore, esegui il job, crei uno snapshot dell'output, elimini l'istanza: costa meno che noleggiare su AWS/GCP per lo stesso carico di lavoro.

80 GB

A100 VRAM

40 Gbps

Collegamento ascendente

Pronto per CUDA

Immagine

4 ×

Max GPU

35%

Sconto annuale

14 giorni

Rimborso del denaro

Prezzi

Piani GPU in evidenza. Orario o annuale.

La fatturazione annuale è attualmente Sconto del 35% su ogni piano GPU.

Più popolare

1× RTX 6000 Pro

48 GB GDDR6 ECC VRAM

$845 /mese

$1300/mo -35%

Distribuisci ora

Rimborso entro 14 giorni

200 GB DDR5
24 vCPU
1.3 TB NVMe NVMe
20 TB · 40 Gbps
CUDA preinstallato

Vedi tutti i 9 piani GPU (da 1× a 4× schede)

Domande frequenti. GPU VPS

Domande frequenti, risposte dirette.

Quali GPU offre Cloudzy?

Quattro famiglie: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, livello professionale per inferenza e rendering), Nvidia A100 (1× / 2× / 4×, per training ML, carichi fp16/bf16, e 80 GB HBM2e per scheda), RTX 5090 (1× / 2×, architettura Blackwell di nuova generazione, ideale per inferenza e rendering), e RTX 4090 (1× / 2× / 4×, conveniente per Stable Diffusion, inferenza LLM e rendering 3D).

Le GPU sono dedicate o condivise?

Dedicate. Ogni piano assegna la GPU fisica completa in passthrough, non una porzione, non vGPU, non MIG. I CUDA core, la VRAM, la banda PCIe: tutto tuo. I piani multi-GPU usano NVLink dove l'hardware fisico lo supporta (piani multi-GPU A100).

CUDA è preinstallato?

Sì. Ogni VPS GPU include il toolkit CUDA stabile più recente, cuDNN e i driver Nvidia già integrati nell'immagine Ubuntu. PyTorch, TensorFlow, JAX e lo stack Hugging Face sono pronti all'uso. Puoi reinstallare un'immagine Ubuntu pulita senza CUDA se vuoi installare una versione specifica.

Quanta VRAM ho a disposizione?

Per scheda: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. I piani multi-GPU sommano questi valori: un piano 4× A100 ha 320 GB totali di VRAM. L'elenco dei piani riporta la RAM di sistema separatamente.

Posso eseguire Stable Diffusion / Llama / Whisper su un VPS GPU?

Sì. Il piano 1× RTX 4090 è un buon punto di partenza: VRAM sufficiente per l'inferenza SDXL, Llama 3 70B (quantizzato a 4 bit) o Whisper Large. Passa a RTX 5090 o A100 se devi eseguire modelli 70B non quantizzati o addestrare LoRA.

Come si confrontano i prezzi con AWS / Google Cloud / Lambda Labs?

In generale siamo più convenienti per carichi di lavoro continuativi: non distinguiamo tra prezzi 'on-demand' e 'spot' e non applichiamo costi di uscita. Non citeremo i prezzi dei competitor (cambiano ogni mese). La garanzia soddisfatti o rimborsati di 14 giorni ti permette di confrontarci con il tuo provider attuale usando i tuoi benchmark.

È previsto uno sconto annuale?

Sì, il 35% di sconto sulla fatturazione annuale per ogni piano GPU (inferiore al 50% dei normali CPU perché l'hardware GPU ha costi di ammortamento più elevati). Nessun rinnovo automatico: riceverai una fattura prima di ogni ciclo annuale, così puoi effettuare un downgrade, un upgrade o annullare senza sorprese in bolletta.

E la rete? Sono davvero 40 Gbps?

Sì. Gli stessi uplink da 40 Gbps del nostro Cloud VPS di punta, senza costi di uscita sul traffico mensile fino alla soglia del piano. Utile per trasferire grandi dataset da e verso il nodo GPU: scaricare un modello Hugging Face da 100 GB richiede circa 30 secondi alla velocità massima della linea.

Posso eseguire training multi-nodo (più VPS GPU insieme)?

Sì, all'interno della stessa region. I VPS nello stesso datacenter condividono la rete locale con latenza inferiore al millisecondo. Al momento non offriamo interconnessione InfiniBand: il training multi-nodo su Ethernet standard è adatto al fine-tuning e a job distribuiti di piccola scala, ma non è competitivo con l'HPC bare-metal per il pre-training su larga scala.

C'è la garanzia soddisfatti o rimborsati sui piani GPU?

14 giorni, senza domande. Rimborso entro un ciclo di fatturazione. Tempo più che sufficiente per misurare il throughput CUDA, eseguire un vero step di training e decidere se Cloudzy è la scelta giusta per il tuo workload.

Smetti di pagare i prezzi degli hyperscaler.
Addestra su GPU dedicati.

Scegli la scheda, scegli la region, clicca. CUDA è già installato.