50% korting alle abonnementen, tijdelijk aanbod. Vanaf $2.48/mo

GPU VPS-hosting

RTX 6000 Pro. A100. RTX 5090.
Dedicated, niet gedeeld.

Volledige GPU passthrough. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN en PyTorch vooraf geïnstalleerd.
NVMe + 40 Gbps netwerk. Onafhankelijke cloud sinds 2008.

4.6 · 728 reviews on Trustpilot

Vanaf $506.35/mo · 35% korting bij jaarlijkse betaling · Geen creditcard nodig

~ ssh root@gpu-train-001 verbonden
root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS in het kort

Cloudzy biedt GPU VPS-abonnementen met dedicated RTX 6000 Pro, Nvidia A100, RTX 5090, en RTX 4090 kaarten in 1× tot 4× configuraties, vanaf $506.35 per month. Elk abonnement wordt geleverd met de nieuwste CUDA, cuDNN, en Nvidia-drivers, draait op AMD EPYC + DDR5 met Alleen NVMe opslag en 40 Gbps uplinks, en is klaar in 60 seconden. GPUs zijn dedicated passthrough, geen vGPU, geen MIG, niet gedeeld. Cloudzy opereert onafhankelijk sinds 2008 en is beoordeeld 4.6 / 5 by 728+ reviewers op Trustpilot.

Startprijs
$506.35 / mo
GPU-typen
6000 Pro · A100 · 5090 · 4090
Configuraties
1× tot 4×
CUDA
Vooraf geïnstalleerd
Jaarlijkse korting
35% korting
Geld terug
14 dagen

Waarom ML-teams kiezen voor Cloudzy

GPU-rekenkracht, de op een niet-saaie manier.

De vier redenen waarom teams overstappen naar Cloudzy vanuit AWS / GCP / hyperscaler GPUs.

Dedicated GPU passthrough → Doorschakeling van toegewezen GPU

De volledige fysieke kaart is van jou: geen vGPU-slicing, geen MIG-partities, geen concurrentie met andere gebruikers. CUDA-cores, VRAM, PCIe-lanes, alles dedicated.

CUDA-klaar afbeeldingen

Nieuwste Nvidia-drivers, CUDA toolkit en cuDNN ingebakken in het Ubuntu-image. PyTorch, TensorFlow, JAX, Hugging Face, pip install en je kunt direct trainen.

NVMe + 40 Gbps

Pure NVMe-opslag zodat het laden van datasets nooit de bottleneck is. Met 40 Gbps netwerk is een Hugging Face-model van 100 GB in seconden binnengehaald, niet minuten.

24/7 menselijke ondersteuning

Echte engineers in de chat. We hebben genoeg teams geholpen met multi-GPU training, het debuggen van CUDA OOMs en het finetunen van Llama-inferentie, dus de antwoorden komen snel.

GPU-aanbod

Vier families.
Negen manieren om op te schalen.

RTX 6000 Pro voor professionele inferentie en rendering met 48 GB ECC VRAM. A100 voor training en workloads met veel VRAM. RTX 5090 voor de nieuwste inferentie. RTX 4090 voor kosteneffectieve inferentie tot 70B (4-bit). Multi-GPU-plannen beschikbaar - kies wat past bij jouw VRAM-budget.

Volledige GPU-doorverbinding, niet gedeeld of opgesplitst
RTX 6000 Pro
48 GB GDDR6 ECC · Pro-grade
Nvidia A100
80 GB HBM2e · ML training
RTX 5090
32 GB GDDR7 · Blackwell
RTX 4090
24 GB GDDR6X · cost-effective
1× tot 4× GPU
Multi-GPU-plannen beschikbaar
CUDA voorgeïnstalleerd
PyTorch · TF · JAX klaar
Zuiver NVMe
Snelle dataset I/O
40 Gbps uplink
Download 100 GB modellen in 30s

Gebruiksscenario's

De workloads waarvoor onze
klanten daadwerkelijk trainen.

LLM-gevolgtrekking

Serveer Llama 3, Mistral, DeepSeek of Qwen met vLLM of Text Generation Inference. RTX 4090 verwerkt 70B op 4-bit, RTX 5090 verwerkt 70B op 8-bit, A100 verwerkt ongekwantiseerd.

Stable Diffusion · beeldgeneratie

Draai SDXL, Flux of gefinetuned Stable Diffusion-checkpoints met ComfyUI of Automatic1111. RTX 4090 haalt 30+ afbeeldingen/min op standaard 1024×1024 SDXL.

ML-training en finetuning

LoRA, QLoRA, volledige finetuning. A100 is de beste keuze voor ongekwantiseerde finetuning van 7B-13B-modellen; 4× A100 verwerkt tot 70B met goede sharding (FSDP / DeepSpeed).

3D-rendering · Blender

Cycles en OptiX op RTX-kaarten is de snelste optie voor animatiestudio's. De 24 GB VRAM op de RTX 4090 is voldoende voor de overgrote meerderheid van single-frame productiescènes.

Spraak- en visionpipelines

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Zelfs het RTX 4090-plan draait real-time inferentie op deze modellen, met ruimte over.

Langlopende batchtaken

Embeddinggeneratie, retrieval-pipelines, dataset-preprocessing. Betaal per uur, voer de taak uit, maak een snapshot van de uitvoer, verwijder de server. Goedkoper dan huren op AWS/GCP voor dezelfde workload.

80 GB
A100 VRAM
40 Gbps
Opwaartse verbinding
CUDA-gereed
Afbeelding
4 ×
Max GPU's
35%
Jaarlijks korting
14 dagen
Geld terug

Prijzen

Uitgelichte GPU-plannen. Per uur of per jaar.

Jaarlijkse facturering geeft momenteel 35% korting op elk GPU-plan.

Veelgestelde vragen. GPU VPS

Veelgestelde vragen duidelijke antwoorden.

Welke GPU's biedt Cloudzy aan?

Vier families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, professioneel voor inferentie en rendering), Nvidia A100 (1× / 2× / 4×, voor ML-training, fp16/bf16-workloads en 80 GB HBM2e per kaart), RTX 5090 (1× / 2×, nieuwere Blackwell-architectuur, ideaal voor inferentie en rendering), en RTX 4090 (1× / 2× / 4×, kosteneffectief voor Stable Diffusion, LLM-inferentie en 3D-rendering).

Zijn de GPUs dedicated of gedeeld?

Dedicated. Elk plan geeft je volledige, directe toegang tot de fysieke GPU(s), geen slice, geen vGPU, geen MIG. De CUDA-cores, de RAM, de PCIe-bandbreedte: allemaal van jou. Multi-GPU-plannen gebruiken NVLink waar de fysieke hardware dit ondersteunt (A100 multi-GPU-plannen).

Is CUDA vooraf geïnstalleerd?

Ja. Elke GPU VPS wordt geleverd met de nieuwste stabiele CUDA toolkit, cuDNN en Nvidia-drivers, vooraf ingebakken in de Ubuntu-image. PyTorch, TensorFlow, JAX en de Hugging Face-stack werken direct zonder configuratie. Wil je een specifieke versie installeren, dan kun je terugkeren naar een schone Ubuntu-image zonder CUDA.

Hoeveel RAM krijg ik?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Bij multi-GPU-plannen telt dit op: een 4× A100-plan heeft in totaal 320 GB RAM. De plannenlijst hierboven toont het systeem-RAM apart.

Kan ik Stable Diffusion / Llama / Whisper draaien op een GPU VPS?

Ja. Het 1× RTX 4090-plan is een goed startpunt: genoeg RAM voor SDXL-inferentie, Llama 3 70B (4-bit gekwantiseerd) of Whisper Large. Ga naar RTX 5090 of A100 als je ongekwantiseerde 70B-modellen wilt draaien of LoRA's wilt trainen.

Hoe verhoudt de prijs zich tot AWS / Google Cloud / Lambda Labs?

Over het algemeen goedkoper voor stabiele workloads. We maken geen onderscheid tussen 'on-demand' en 'spot'-tarieven en rekenen geen egress-kosten. We geven geen concurrentiecijfers (die veranderen maandelijks). Met de 14-dagen geld-terug-garantie kun je gewoon A/B-testen met je huidige provider en je eigen benchmarks.

Is er korting bij jaarlijkse betaling?

Ja, 35% korting op jaarlijkse betaling voor elk GPU-plan (lager dan de 50% op reguliere CPU-plannen, omdat GPU-hardware meer afschrijving vergt). Geen automatische verlenging: je ontvangt een factuur vóór elk jaarlijks verlengingsmoment, zodat je zonder verrassingen kunt downgraden, upgraden of opzeggen.

Hoe zit het met het netwerk? Is het echt 40 Gbps?

Ja. Dezelfde 40 Gbps-uplinks als onze Cloud VPS, zonder egress-kosten voor maandelijks dataverkeer tot het plan-allowance. Handig voor het overzetten van grote datasets naar en van het GPU-knooppunt: een Hugging Face-model van 100 GB ophalen duurt op lijnsnelheid ongeveer 30 seconden.

Kan ik multi-node training draaien (meerdere GPU VPS samen)?

Ja, binnen dezelfde regio. VPS in hetzelfde datacenter delen het lokale netwerk met sub-milliseconde latentie. We bieden momenteel geen InfiniBand-interconnect aan. Multi-node training via standaard Ethernet werkt prima voor fine-tuning en kleinschalige gedistribueerde taken, maar kan niet concurreren met bare-metal HPC voor grootschalige pre-training.

Geldt de geld-terug-garantie ook voor GPU-plannen?

14 dagen, geen vragen gesteld. Terugbetaling binnen één factuurcyclus. Ruim voldoende tijd om CUDA-doorvoer te benchmarken, een echte trainingsstap uit te voeren en te bepalen of Cloudzy de juiste keuze is voor jouw workload.

Stop met betalen voor hyperscaler-prijzen.
Train op dedicated GPUs.

Kies een kaart, kies een regio, klik. CUDA is al geïnstalleerd.

Geen creditcard vereist · 14 dagen geld-terug-garantie · Op elk moment opzegbaar