50% di sconto tutti i piani, offerta a tempo limitato. A partire da $2.48/mo

Hosting VPS GPU

RTX 6000 Pro. A100. RTX 5090.
Dedicata, non condivisa.

GPU in passthrough completo. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN e PyTorch preinstallati.
NVMe + rete a 40 Gbps. Cloud indipendente dal 2008.

4.6 · 728 reviews on Trustpilot

A partire da $506.35/mo · 35% di sconto con piano annuale · Nessuna carta di credito richiesta

~ ssh root@gpu-train-001 connesso
root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS in breve

Cloudzy vende piani GPU VPS con RTX 6000 Pro, Nvidia A100, RTX 5090, e RTX 4090 carte in da 1× a 4× configurazioni, a partire da $506.35 per month. Ogni piano viene fornito con la versione più recente di CUDA, cuDNN, e driver Nvidia preinstallati, gira su AMD EPYC + DDR5 con Solo NVMe archiviazione e 40 Gbps uplink, ed è pronto in 60 secondi. Le GPU sono passthrough dedicato, non vGPU, non MIG, non condivise. Cloudzy opera in modo indipendente dal 2008 e ha un rating 4.6 / 5 by 728+ reviewers su Trustpilot.

Prezzo di partenza
$506.35 / mo
tipi di GPU
6000 Pro · A100 · 5090 · 4090
Configurazioni
da 1× a 4×
CUDA
Preinstallato
Sconto annuale
Sconto del 35%
Rimborso del denaro
14 giorni

Perché i team ML scelgono Cloudzy

Calcolo GPU al in modo non noioso.

I quattro motivi per cui i team passano a Cloudzy da AWS / GCP / GPU degli hyperscaler.

Passthrough GPU dedicato

La scheda fisica è interamente tua: niente slicing vGPU, niente partizioni MIG, niente contesa con altri tenant. CUDA core, VRAM, lane PCIe, tutto dedicato.

Immagini CUDA-ready

Driver Nvidia, CUDA toolkit e cuDNN preinstallati nell'immagine Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install e puoi già addestrare.

NVMe + 40 Gbps

Storage NVMe puro, così il caricamento dei dataset non è mai il collo di bottiglia. Con 40 Gbps di rete, scaricare un modello Hugging Face da 100 GB richiede secondi, non minuti.

Supporto umano 24/7

Ingegneri veri in chat. Abbiamo aiutato abbastanza team a configurare training multi-GPU, diagnosticare CUDA OOM e ottimizzare l'inferenza Llama da rispondere in tempi rapidi.

Gamma di GPU

Quattro famiglie.
Nove opzioni di scalabilità.

RTX 6000 Pro per inferenza e rendering professionali con 48 GB di VRAM ECC. A100 per training e workload con VRAM elevata. RTX 5090 per l'inferenza più recente. RTX 4090 per inferenza economica fino a 70B (4-bit). Piani multi-GPU disponibili: scegli in base al tuo budget di VRAM.

Passthrough GPU completo, non suddiviso, non condiviso
RTX 6000 Pro
48 GB GDDR6 ECC · Pro-grade
Nvidia A100
80 GB HBM2e · ML training
RTX 5090
32 GB GDDR7 · Blackwell
RTX 4090
24 GB GDDR6X · cost-effective
da 1× a 4× GPU
Piani multi-GPU disponibili
CUDA preinstallato
PyTorch · TF · JAX pronto
NVMe Puro
Dataset I/O veloce
40 Gbps uplink
Estrai modelli da 100 GB in 30s

Casi d'uso

I workload dei nostri
i clienti allenano davvero.

Inferenza LLM

Servi Llama 3, Mistral, DeepSeek o Qwen con vLLM o Text Generation Inference. RTX 4090 gestisce modelli da 70B a 4-bit, RTX 5090 a 8-bit, A100 senza quantizzazione.

Stable Diffusion · generazione immagini

Esegui checkpoint SDXL, Flux o Stable Diffusion fine-tuned con ComfyUI o Automatic1111. RTX 4090 supera le 30 immagini/min su SDXL standard a 1024×1024.

Training ML e fine-tuning

LoRA, QLoRA, fine-tuning completo. A100 è la scelta ideale per il fine-tuning non quantizzato di modelli 7B-13B; 4× A100 arriva fino a 70B con sharding corretto (FSDP / DeepSpeed).

Rendering 3D · Blender

Cycles e OptiX su schede RTX sono la via più rapida per gli studi di animazione. I 24 GB VRAM di RTX 4090 coprono la grande maggioranza delle scene di produzione a frame singolo.

Pipeline di audio e visione

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Anche il piano RTX 4090 esegue inferenza in tempo reale su questi modelli con ampio margine.

Job batch a lunga esecuzione

Generazione di embedding, pipeline di retrieval, preprocessing dei dataset. Paghi a ore, esegui il job, crei uno snapshot dell'output, elimini l'istanza: costa meno che noleggiare su AWS/GCP per lo stesso carico di lavoro.

80 GB
A100 VRAM
40 Gbps
Collegamento ascendente
Pronto per CUDA
Immagine
4 ×
Max GPU
35%
Sconto annuale
14 giorni
Rimborso del denaro

Prezzi

Piani GPU in evidenza. Orario o annuale.

La fatturazione annuale è attualmente Sconto del 35% su ogni piano GPU.

Domande frequenti. GPU VPS

Domande frequenti, risposte dirette.

Quali GPU offre Cloudzy?

Quattro famiglie: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, livello professionale per inferenza e rendering), Nvidia A100 (1× / 2× / 4×, per training ML, carichi fp16/bf16, e 80 GB HBM2e per scheda), RTX 5090 (1× / 2×, architettura Blackwell di nuova generazione, ideale per inferenza e rendering), e RTX 4090 (1× / 2× / 4×, conveniente per Stable Diffusion, inferenza LLM e rendering 3D).

Le GPU sono dedicate o condivise?

Dedicate. Ogni piano assegna la GPU fisica completa in passthrough, non una porzione, non vGPU, non MIG. I CUDA core, la VRAM, la banda PCIe: tutto tuo. I piani multi-GPU usano NVLink dove l'hardware fisico lo supporta (piani multi-GPU A100).

CUDA è preinstallato?

Sì. Ogni VPS GPU include il toolkit CUDA stabile più recente, cuDNN e i driver Nvidia già integrati nell'immagine Ubuntu. PyTorch, TensorFlow, JAX e lo stack Hugging Face sono pronti all'uso. Puoi reinstallare un'immagine Ubuntu pulita senza CUDA se vuoi installare una versione specifica.

Quanta VRAM ho a disposizione?

Per scheda: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. I piani multi-GPU sommano questi valori: un piano 4× A100 ha 320 GB totali di VRAM. L'elenco dei piani riporta la RAM di sistema separatamente.

Posso eseguire Stable Diffusion / Llama / Whisper su un VPS GPU?

Sì. Il piano 1× RTX 4090 è un buon punto di partenza: VRAM sufficiente per l'inferenza SDXL, Llama 3 70B (quantizzato a 4 bit) o Whisper Large. Passa a RTX 5090 o A100 se devi eseguire modelli 70B non quantizzati o addestrare LoRA.

Come si confrontano i prezzi con AWS / Google Cloud / Lambda Labs?

In generale siamo più convenienti per carichi di lavoro continuativi: non distinguiamo tra prezzi 'on-demand' e 'spot' e non applichiamo costi di uscita. Non citeremo i prezzi dei competitor (cambiano ogni mese). La garanzia soddisfatti o rimborsati di 14 giorni ti permette di confrontarci con il tuo provider attuale usando i tuoi benchmark.

È previsto uno sconto annuale?

Sì, il 35% di sconto sulla fatturazione annuale per ogni piano GPU (inferiore al 50% dei normali CPU perché l'hardware GPU ha costi di ammortamento più elevati). Nessun rinnovo automatico: riceverai una fattura prima di ogni ciclo annuale, così puoi effettuare un downgrade, un upgrade o annullare senza sorprese in bolletta.

E la rete? Sono davvero 40 Gbps?

Sì. Gli stessi uplink da 40 Gbps del nostro Cloud VPS di punta, senza costi di uscita sul traffico mensile fino alla soglia del piano. Utile per trasferire grandi dataset da e verso il nodo GPU: scaricare un modello Hugging Face da 100 GB richiede circa 30 secondi alla velocità massima della linea.

Posso eseguire training multi-nodo (più VPS GPU insieme)?

Sì, all'interno della stessa region. I VPS nello stesso datacenter condividono la rete locale con latenza inferiore al millisecondo. Al momento non offriamo interconnessione InfiniBand: il training multi-nodo su Ethernet standard è adatto al fine-tuning e a job distribuiti di piccola scala, ma non è competitivo con l'HPC bare-metal per il pre-training su larga scala.

C'è la garanzia soddisfatti o rimborsati sui piani GPU?

14 giorni, senza domande. Rimborso entro un ciclo di fatturazione. Tempo più che sufficiente per misurare il throughput CUDA, eseguire un vero step di training e decidere se Cloudzy è la scelta giusta per il tuo workload.

Smetti di pagare i prezzi degli hyperscaler.
Addestra su GPU dedicati.

Scegli la scheda, scegli la region, clicca. CUDA è già installato.

Nessuna carta di credito richiesta · Garanzia soddisfatti o rimborsati di 14 giorni · Disdici quando vuoi