Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

GPU VPS-hosting

RTX 6000 Pro. A100. RTX 5090.
Dedicated, niet gedeeld.

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

Volledige GPU passthrough. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN en PyTorch vooraf geïnstalleerd.
NVMe + 40 Gbps netwerk. Onafhankelijke cloud sinds 2008.

4.6 · 728 reviews on Trustpilot

GPU VPS deployen Vergelijk GPU-abonnementen

Vanaf $506.35/mo · 35% korting bij jaarlijkse betaling · Geen creditcard nodig

~ ssh root@gpu-train-001 verbonden

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS in het kort

Cloudzy biedt GPU VPS-abonnementen met dedicated RTX 6000 Pro, Nvidia A100, RTX 5090, en RTX 4090 kaarten in 1× tot 4× configuraties, vanaf $506.35 per month. Elk abonnement wordt geleverd met de nieuwste CUDA, cuDNN, en Nvidia-drivers, draait op AMD EPYC + DDR5 met Alleen NVMe opslag en 40 Gbps uplinks, en is klaar in 60 seconden. GPUs zijn dedicated passthrough, geen vGPU, geen MIG, niet gedeeld. Cloudzy opereert onafhankelijk sinds 2008 en is beoordeeld 4.6 / 5 by 728+ reviewers op Trustpilot.

Startprijs: $506.35 / mo
GPU-typen: 6000 Pro · A100 · 5090 · 4090
Configuraties: 1× tot 4×
CUDA: Vooraf geïnstalleerd
Jaarlijkse korting: 35% korting
Geld terug: 14 dagen

Waarom ML-teams kiezen voor Cloudzy

GPU-rekenkracht, de op een niet-saaie manier.

De vier redenen waarom teams overstappen naar Cloudzy vanuit AWS / GCP / hyperscaler GPUs.

Dedicated GPU passthrough → Doorschakeling van toegewezen GPU

De volledige fysieke kaart is van jou: geen vGPU-slicing, geen MIG-partities, geen concurrentie met andere gebruikers. CUDA-cores, VRAM, PCIe-lanes, alles dedicated.

CUDA-klaar afbeeldingen

Nieuwste Nvidia-drivers, CUDA toolkit en cuDNN ingebakken in het Ubuntu-image. PyTorch, TensorFlow, JAX, Hugging Face, pip install en je kunt direct trainen.

NVMe + 40 Gbps

Pure NVMe-opslag zodat het laden van datasets nooit de bottleneck is. Met 40 Gbps netwerk is een Hugging Face-model van 100 GB in seconden binnengehaald, niet minuten.

24/7 menselijke ondersteuning

Echte engineers in de chat. We hebben genoeg teams geholpen met multi-GPU training, het debuggen van CUDA OOMs en het finetunen van Llama-inferentie, dus de antwoorden komen snel.

GPU-aanbod

Vier families.
Negen manieren om op te schalen.

RTX 6000 Pro voor professionele inferentie en rendering met 48 GB ECC VRAM. A100 voor training en workloads met veel VRAM. RTX 5090 voor de nieuwste inferentie. RTX 4090 voor kosteneffectieve inferentie tot 70B (4-bit). Multi-GPU-plannen beschikbaar - kies wat past bij jouw VRAM-budget.

Volledige GPU-doorverbinding, niet gedeeld of opgesplitst

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

1× tot 4× GPU

Multi-GPU-plannen beschikbaar

CUDA voorgeïnstalleerd

PyTorch · TF · JAX klaar

Zuiver NVMe

Snelle dataset I/O

40 Gbps uplink

Download 100 GB modellen in 30s

Gebruiksscenario's

De workloads waarvoor onze
klanten daadwerkelijk trainen.

LLM-gevolgtrekking

Serveer Llama 3, Mistral, DeepSeek of Qwen met vLLM of Text Generation Inference. RTX 4090 verwerkt 70B op 4-bit, RTX 5090 verwerkt 70B op 8-bit, A100 verwerkt ongekwantiseerd.

Stable Diffusion · beeldgeneratie

Draai SDXL, Flux of gefinetuned Stable Diffusion-checkpoints met ComfyUI of Automatic1111. RTX 4090 haalt 30+ afbeeldingen/min op standaard 1024×1024 SDXL.

ML-training en finetuning

LoRA, QLoRA, volledige finetuning. A100 is de beste keuze voor ongekwantiseerde finetuning van 7B-13B-modellen; 4× A100 verwerkt tot 70B met goede sharding (FSDP / DeepSpeed).

3D-rendering · Blender

Cycles en OptiX op RTX-kaarten is de snelste optie voor animatiestudio's. De 24 GB VRAM op de RTX 4090 is voldoende voor de overgrote meerderheid van single-frame productiescènes.

Spraak- en visionpipelines

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Zelfs het RTX 4090-plan draait real-time inferentie op deze modellen, met ruimte over.

Langlopende batchtaken

Embeddinggeneratie, retrieval-pipelines, dataset-preprocessing. Betaal per uur, voer de taak uit, maak een snapshot van de uitvoer, verwijder de server. Goedkoper dan huren op AWS/GCP voor dezelfde workload.

80 GB

A100 VRAM

40 Gbps

Opwaartse verbinding

CUDA-gereed

Afbeelding

4 ×

Max GPU's

35%

Jaarlijks korting

14 dagen

Geld terug

Prijzen

Uitgelichte GPU-plannen. Per uur of per jaar.

Jaarlijkse facturering geeft momenteel 35% korting op elk GPU-plan.

Populairste

1× RTX 6000 Pro

48 GB GDDR6 ECC VRAM

$845 /maand

$1300/mo -35%

Implementeer nu

14 dagen geld-terug-garantie

200 GB DDR5
24 vCPU
1.3 TB NVMe NVMe
20 TB · 40 Gbps
CUDA voorgeïnstalleerd

Bekijk alle 9 GPU-plannen (1× tot 4× kaarten)

Veelgestelde vragen. GPU VPS

Veelgestelde vragen duidelijke antwoorden.

Welke GPU's biedt Cloudzy aan?

Vier families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, professioneel voor inferentie en rendering), Nvidia A100 (1× / 2× / 4×, voor ML-training, fp16/bf16-workloads en 80 GB HBM2e per kaart), RTX 5090 (1× / 2×, nieuwere Blackwell-architectuur, ideaal voor inferentie en rendering), en RTX 4090 (1× / 2× / 4×, kosteneffectief voor Stable Diffusion, LLM-inferentie en 3D-rendering).

Zijn de GPUs dedicated of gedeeld?

Dedicated. Elk plan geeft je volledige, directe toegang tot de fysieke GPU(s), geen slice, geen vGPU, geen MIG. De CUDA-cores, de RAM, de PCIe-bandbreedte: allemaal van jou. Multi-GPU-plannen gebruiken NVLink waar de fysieke hardware dit ondersteunt (A100 multi-GPU-plannen).

Is CUDA vooraf geïnstalleerd?

Ja. Elke GPU VPS wordt geleverd met de nieuwste stabiele CUDA toolkit, cuDNN en Nvidia-drivers, vooraf ingebakken in de Ubuntu-image. PyTorch, TensorFlow, JAX en de Hugging Face-stack werken direct zonder configuratie. Wil je een specifieke versie installeren, dan kun je terugkeren naar een schone Ubuntu-image zonder CUDA.

Hoeveel RAM krijg ik?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Bij multi-GPU-plannen telt dit op: een 4× A100-plan heeft in totaal 320 GB RAM. De plannenlijst hierboven toont het systeem-RAM apart.

Kan ik Stable Diffusion / Llama / Whisper draaien op een GPU VPS?

Ja. Het 1× RTX 4090-plan is een goed startpunt: genoeg RAM voor SDXL-inferentie, Llama 3 70B (4-bit gekwantiseerd) of Whisper Large. Ga naar RTX 5090 of A100 als je ongekwantiseerde 70B-modellen wilt draaien of LoRA's wilt trainen.

Hoe verhoudt de prijs zich tot AWS / Google Cloud / Lambda Labs?

Over het algemeen goedkoper voor stabiele workloads. We maken geen onderscheid tussen 'on-demand' en 'spot'-tarieven en rekenen geen egress-kosten. We geven geen concurrentiecijfers (die veranderen maandelijks). Met de 14-dagen geld-terug-garantie kun je gewoon A/B-testen met je huidige provider en je eigen benchmarks.

Is er korting bij jaarlijkse betaling?

Ja, 35% korting op jaarlijkse betaling voor elk GPU-plan (lager dan de 50% op reguliere CPU-plannen, omdat GPU-hardware meer afschrijving vergt). Geen automatische verlenging: je ontvangt een factuur vóór elk jaarlijks verlengingsmoment, zodat je zonder verrassingen kunt downgraden, upgraden of opzeggen.

Hoe zit het met het netwerk? Is het echt 40 Gbps?

Ja. Dezelfde 40 Gbps-uplinks als onze Cloud VPS, zonder egress-kosten voor maandelijks dataverkeer tot het plan-allowance. Handig voor het overzetten van grote datasets naar en van het GPU-knooppunt: een Hugging Face-model van 100 GB ophalen duurt op lijnsnelheid ongeveer 30 seconden.

Kan ik multi-node training draaien (meerdere GPU VPS samen)?

Ja, binnen dezelfde regio. VPS in hetzelfde datacenter delen het lokale netwerk met sub-milliseconde latentie. We bieden momenteel geen InfiniBand-interconnect aan. Multi-node training via standaard Ethernet werkt prima voor fine-tuning en kleinschalige gedistribueerde taken, maar kan niet concurreren met bare-metal HPC voor grootschalige pre-training.

Geldt de geld-terug-garantie ook voor GPU-plannen?

14 dagen, geen vragen gesteld. Terugbetaling binnen één factuurcyclus. Ruim voldoende tijd om CUDA-doorvoer te benchmarken, een echte trainingsstap uit te voeren en te bepalen of Cloudzy de juiste keuze is voor jouw workload.

Stop met betalen voor hyperscaler-prijzen.
Train op dedicated GPUs.

Kies een kaart, kies een regio, klik. CUDA is al geïnstalleerd.