50% rabat alle planer, tidsbegrænset. Fra $2.48/mo

GPU VPS-hosting

RTX 6000 Pro. A100. RTX 5090.
Dedikeret, ikke delt.

Fuld GPU passthrough. RTX 6000 Pro, A100, RTX 5090, RTX 4090. Forudinstalleret CUDA, cuDNN, PyTorch klar.
NVMe + 40 Gbps netværk. Uafhængig cloud siden 2008.

4.7 · 747 anmeldelser på Trustpilot

Fra $506.35/mo · 35% rabat ved årlig betaling · Intet kreditkort kræves

~ ssh root@gpu-train-001 forbundet
root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS på et øjeblik

Cloudzy sælger GPU VPS-planer med dedikeret RTX 6000 Pro, Nvidia A100, RTX 5090, og RTX 4090 kort i 1× til 4× konfigurationer, startende fra $506.35 per month. Hver plan leveres med den nyeste CUDA, cuDNN, og Nvidia-drivere forudinstalleret, kører på AMD EPYC + DDR5 med NVMe-kun lagring og 40 Gbps uplinks og er klar på 60 sekunder. GPU er dedikeret passthrough – ikke vGPU, ikke MIG, ikke delt. Cloudzy har opereret uafhængigt siden 2008 og er bedømt 4.7 / 5 by 747+ anmeldere på Trustpilot.

Startpris
$506.35 / mo
GPU-typer
6000 Pro · A100 · 5090 · 4090
Konfigurationer
1× til 4×
CUDA
Forinstalleret
Årlig rabat
35% rabat
Penge-tilbage
14 dage

Hvorfor ML-teams vælger Cloudzy

GPU-compute, som udboring måde.

De fire grunde til, at teams skifter til Cloudzy fra AWS / GCP / hyperscaler GPU.

Dedikeret GPU passthrough

Du får hele det fysiske kort for dig selv. Ingen vGPU-opdeling, ingen MIG-partitioner, ingen konkurrence med andre lejere. CUDA-kerner, VRAM, PCIe-lanes - alt dedikeret.

CUDA-klar images

Nyeste Nvidia-drivere, CUDA toolkit og cuDNN er forudinstalleret i Ubuntu-imaget. PyTorch, TensorFlow, JAX, Hugging Face, pip install og du er i gang med træningen.

NVMe + 40 Gbps

Ren NVMe-storage, så indlæsning af datasæt ikke er flaskehalsen. 40 Gbps netværk betyder, at en Hugging Face-model på 100 GB er hentet på sekunder, ikke minutter.

Menneskelig support døgnet rundt

Rigtige ingeniører i chatten. Vi har hjulpet nok teams med at opsætte multi-GPU-træning, fejlfinde CUDA OOM-fejl og tune Llama-inferens til, at svarene kommer hurtigt.

GPU-serie

Fire familier.
Ni måder at skalere på.

RTX 6000 Pro til professionel inferens og rendering med 48 GB ECC VRAM. A100 til træning og workloads med stor VRAM. RTX 5090 til den nyeste inferens. RTX 4090 til omkostningseffektiv inferens op til 70B (4-bit). Multi-GPU-planer er tilgængelige - vælg det, dit VRAM-budget kræver.

Fuld GPU passthrough, ikke opdelt, ikke delt
RTX 6000 Pro
48 GB GDDR6 ECC · Pro-grade
Nvidia A100
80 GB HBM2e · ML training
RTX 5090
32 GB GDDR7 · Blackwell
RTX 4090
24 GB GDDR6X · cost-effective
1× til 4× GPU
Multi-GPU-planer tilgængelige
CUDA forinstalleret
PyTorch · TF · JAX klar
Rent NVMe
Hurtig datasæt I/O
40 Gbps uplink
Hent 100 GB-modeller på 30s

Brugsscenarier

De workloads, vores
faktisk træner på.

LLM-inferens

Kør Llama 3, Mistral, DeepSeek eller Qwen med vLLM eller Text Generation Inference. RTX 4090 håndterer 70B ved 4-bit, RTX 5090 håndterer 70B ved 8-bit, A100 håndterer ukvanticeret.

Stable Diffusion · billedgenerering

Kør SDXL, Flux eller finjusterede Stable Diffusion-checkpoints med ComfyUI eller Automatic1111. RTX 4090 leverer 30+ billeder/min ved standard 1024×1024 SDXL.

ML-træning + finjustering

LoRA, QLoRA, fuld finjustering. A100 er det optimale valg til 7B-13B ukvanticeret finjustering; 4× A100 håndterer op til 70B med korrekt sharding (FSDP / DeepSpeed).

3D-rendering · Blender

Cycles + OptiX på RTX-kort er den hurtigste løsning for animationsstudier. De 24 GB VRAM på RTX 4090 dækker langt størstedelen af enkeltbillede produktionsscener.

Tale- + billedbehandlingspipelines

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Selv RTX 4090-planen kører realtidsinference på disse modeller med god margin.

Langvarige batch-jobs

Embedding-generering, retrieval-pipelines, forbehandling af datasæt. Betal pr. time, kør jobbet, tag et snapshot af outputtet, slet instansen - billigere end at leje på AWS/GCP for samme arbejdsbyrde.

80 GB
A100 VRAM
40 Gbps
Oplink
CUDA-klar
Billede
4 ×
Maks GPU'er
35%
Årlig rabat
14 dage
Penge-tilbage

Priser

Udvalgte GPU-planer. Timebetaling eller årligt.

Årlig fakturering er i øjeblikket 35% rabat på alle GPU-planer.

Ofte stillede spørgsmål. GPU VPS

Typiske spørgsmål, klare svar.

Hvilke GPU'er tilbyder Cloudzy?

Fire familier: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, professionelt niveau til inference og rendering), Nvidia A100 (1× / 2× / 4×, til ML-træning, fp16/bf16-arbejdsbyrder og 80 GB HBM2e pr. kort), RTX 5090 (1× / 2×, nyere Blackwell-arkitektur, ideel til inference og rendering), og RTX 4090 (1× / 2× / 4×, omkostningseffektiv til Stable Diffusion, LLM-inference og 3D-rendering).

Er GPU'erne dedikerede eller delte?

Dedikerede. Hver plan giver dig adgang til den fulde fysiske GPU - ikke en andel, ikke vGPU, ikke MIG. CUDA-kernerne, VRAM, PCIe-båndbredden: alt er dit. Planer med flere GPU'er bruger NVLink, hvor den fysiske hardware understøtter det (A100-planer med flere GPU'er).

Er CUDA forudinstalleret?

Ja. Alle GPU VPS leveres med den seneste stabile CUDA toolkit, cuDNN og Nvidia-drivere forudinstalleret i Ubuntu-imaget. PyTorch, TensorFlow, JAX og Hugging Face-stakken er klar til brug fra start. Du kan geninstallere til et rent Ubuntu uden CUDA, hvis du vil installere en bestemt version.

Hvor meget VRAM får jeg?

Pr. GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Planer med flere GPU'er lægger dette sammen - en 4× A100-plan har 320 GB VRAM i alt. Planoversigten ovenfor viser system-RAM separat.

Kan jeg køre Stable Diffusion / Llama / Whisper på en GPU VPS?

Ja. RTX 4090 1×-planen er et godt udgangspunkt: nok VRAM til SDXL-inferens, Llama 3 70B (4-bit kvantiseret) eller Whisper Large. Skift til RTX 5090 eller A100, hvis du skal køre ikke-kvantiserede 70B-modeller eller træne LoRAs.

Hvordan er priserne sammenlignet med AWS / Google Cloud / Lambda Labs?

Generelt billigere til stabile arbejdsbelastninger – vi prisdiskriminerer ikke mellem 'on-demand' og 'spot', og vi har ingen udgående trafikgebyrer. Vi citerer ikke konkurrenternes priser (de ændrer sig løbende). Med 14-dages pengene-tilbage-garanti kan du teste os direkte mod din nuværende udbyder med dine egne benchmarks.

Er der rabat ved årlig betaling?

Ja, 35% rabat ved årlig fakturering på alle GPU-planer (lavere end de 50% på almindelige CPU-planer, fordi GPU-hardware er dyrere at afskrive). Ingen automatisk fornyelse - du modtager en faktura før hvert årligt forløb, så du kan nedgradere, opgradere eller opsige uden uventede gebyrer.

Hvad med netværket? Er det virkelig 40 Gbps?

Ja. De samme 40 Gbps-uplinks som vores flagskib Cloud VPS, uden udgående gebyrer på månedlig datatrafik op til planens grænse. Praktisk til at flytte store datasæt ind og ud af GPU-noden – at hente en 100 GB Hugging Face-model tager cirka 30 sekunder ved fuld linjehastighed.

Kan jeg køre multi-node træning (flere GPU VPS sammen)?

Ja, inden for samme region. VPS i samme datacenter deler det lokale netværk med under et millisekunds latenstid. Vi tilbyder ikke InfiniBand-forbindelse på nuværende tidspunkt. Multi-node træning over standard Ethernet fungerer fint til fine-tuning og distribuerede opgaver i mindre skala, men kan ikke konkurrere med bare-metal HPC til stor-skala præ-træning.

Pengene-tilbage-garanti på GPU-planer?

14 dages returret, ingen spørgsmål. Pengene tilbage inden for én faktureringsperiode. Tid nok til at benchmarke CUDA-gennemstrømning, køre et rigtigt træningsforløb og vurdere, om Cloudzy passer til din workload.

Stop med at betale hyperscaler-priser.
Træn på dedikerede GPUs.

Vælg et kort, vælg en region, klik. CUDA er allerede installeret.

Intet kreditkort krævet · 14 dages pengene-tilbage-garanti · Opsig når du vil