Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

Hostování GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Dedikovaný, ne sdílený.

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

Plný passthrough GPU. RTX 6000 Pro, A100, RTX 5090, RTX 4090. Předinstalováno: CUDA, cuDNN, PyTorch.
NVMe + 40 Gbps síť. Nezávislý cloud od roku 2008.

4.6 · 728 reviews on Trustpilot

Nasadit GPU VPS Porovnat plány GPU

Začínající na $506.35/mo · 35% sleva při roční platbě · Kreditní karta není nutná

~ ssh root@gpu-train-001 připojen

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS na první pohled

Cloudzy prodává plány GPU VPS s dedikovaným RTX 6000 Pro, Nvidia A100, RTX 5090, a RTX 4090 karty v 1× až 4× konfigurace, začínající na $506.35 per month. Každý plán je dodáván s předinstalovanou nejnovější verzí CUDA, cuDNN, a ovladači Nvidia, běží na AMD EPYC + DDR5 s Pouze NVMe úložiště a 40 Gbps uplinky a je zprovozněn za 60 sekund. GPUs jsou dedikovaný passthrough, ne vGPU, ne MIG, ne sdílené. Cloudzy funguje nezávisle od roku 2008 a má hodnocení 4.6 / 5 by 728+ reviewers na Trustpilot.

Počáteční cena: $506.35 / mo
Typy GPU: 6000 Pro · A100 · 5090 · 4090
Konfigurace: 1× až 4×
CUDA: Předinstalovaný
Roční sleva: 35% sleva
Vrácení peněz: 14 dní

Proč si ML týmy vybírají Cloudzy

GPU výpočetní výkon pro zajímavým způsobem.

Čtyři důvody, proč týmy přecházejí k Cloudzy od AWS / GCP / hyperscaler GPU.

Dedikovaný passthrough GPU

Celá fyzická karta je jen vaše. Žádné dělení vGPU, žádné MIG oddíly, žádné sdílení s ostatními nájemci. CUDA jádra, VRAM, PCIe linky - vše dedikované.

CUDA-ready obrazy

Nejnovější ovladače Nvidia, CUDA toolkit a cuDNN jsou předem zahrnuty v obrazu Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install a trénování může začít.

NVMe + 40 Gbps

Čistý NVMe storage, takže načítání datasetu není úzké místo. 40 Gbps síť znamená, že stažení modelu Hugging Face o velikosti 100 GB trvá sekundy, ne minuty.

Lidská podpora 24/7

Skuteční inženýři v chatu. Pomohli jsme dostatečnému počtu týmů s nastavením trénování na více GPU, laděním CUDA OOM chyb a optimalizací Llama inference, takže odpovědi přicházejí rychle.

Řada GPU

Čtyři rodiny.
Devět způsobů, jak škálovat.

RTX 6000 Pro pro profesionální inference a rendering s 48 GB ECC VRAM. A100 pro trénování a úlohy s vysokými nároky na VRAM. RTX 5090 pro nejnovější inference. RTX 4090 pro cenově výhodnou inference modelů až 70B (4-bit). K dispozici jsou plány s více GPU - vyberte si podle svého VRAM rozpočtu.

Plný passthrough GPU, bez dělení, bez sdílení

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

1× až 4× GPU

Plány s více GPU k dispozici

CUDA předinstalován

PyTorch · TF · JAX připraveno

Čistý NVMe

Rychlý I/O datové sady

40 Gbps uplink

Stažení modelů o velikosti 100 GB za 30 sekund

Případy použití

Úlohy, které naši
zákazníci skutečně trénují.

Inference LLM

Nasaďte Llama 3, Mistral, DeepSeek nebo Qwen pomocí vLLM nebo Text Generation Inference. RTX 4090 zvládne 70B při 4-bit kvantizaci, RTX 5090 při 8-bit, A100 bez kvantizace.

Stable Diffusion · generování obrázků

Spusťte SDXL, Flux nebo doladěné checkpointy Stable Diffusion přes ComfyUI nebo Automatic1111. RTX 4090 dosáhne 30+ obrázků/min při standardním SDXL rozlišení 1024×1024.

ML trénování + doladění

LoRA, QLoRA, plné doladění. A100 je ideální volba pro 7B–13B bez kvantizace; 4× A100 zvládne až 70B při správném rozdělení (FSDP / DeepSpeed).

3D vykreslování · Blender

Cycles + OptiX na kartách RTX je nejrychlejší cesta pro animační studia. 24 GB VRAM na RTX 4090 pokryje naprostou většinu produkčních scén při renderování jediného snímku.

Pipelines pro řeč a obraz

Whisper Large, Faster-Whisper, YOLO, Segment Anything. I plán RTX 4090 zvládá inference těchto modelů v reálném čase s dostatečnou rezervou.

Dlouhé dávkové úlohy

Generování embeddingů, retrieval pipelines, předzpracování datasetů. Plaťte po hodinách: spusťte úlohu, uložte výstup jako snapshot, zrušte server. Vyjde to levněji než stejná úloha na AWS/GCP.

80 GB

A100 VRAM

40 Gbps

Spojení nahoru

CUDA-ready

Obrázek

4 ×

Maximální počet GPU

35%

Roční sleva

14 dní

Vrácení peněz

Ceny

Doporučené plány GPU. Hodinově nebo ročně.

Roční fakturace je momentálně 35% sleva u každého plánu GPU.

Nejpopulárnější

1× RTX 6000 Pro

48 GB GDDR6 ECC VRAM

$845 /měsíc

$1300/mo -35%

Nasadit nyní

14denní záruka vrácení peněz

200 GB DDR5
24 vCPU
1.3 TB NVMe NVMe
20 TB · 40 Gbps
CUDA předinstalován

Zobrazit všech 9 plánů GPU (1× až 4× karty)

Často kladené otázky. GPU VPS

Běžné otázky, přímé odpovědi.

Které GPU nabízí Cloudzy?

Čtyři řady: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, profesionální úroveň pro inference a renderování), Nvidia A100 (1× / 2× / 4×, pro ML trénování, fp16/bf16 úlohy a 80 GB HBM2e na kartu), RTX 5090 (1× / 2×, novější architektura Blackwell, ideální pro inference a renderování) a RTX 4090 (1× / 2× / 4×, cenově dostupné pro Stable Diffusion, LLM inference a 3D renderování).

Jsou GPU dedikované, nebo sdílené?

Dedikované. Každý plán přiděluje celý fyzický GPU, ne jeho část, ne vGPU, ne MIG. CUDA jádra, VRAM, PCIe šířka pásma - to vše máte jen pro sebe. Plány s více GPU využívají NVLink tam, kde to fyzický hardware podporuje (plány s více A100).

Je CUDA předinstalována?

Ano. Každý GPU VPS se dodává s nejnovějším stabilním CUDA toolkitem, cuDNN a ovladači Nvidia předinstalovanými v obrazu Ubuntu. PyTorch, TensorFlow, JAX i stack Hugging Face jsou připraveny okamžitě k použití. Pokud potřebujete nainstalovat konkrétní verzi, lze obraz přeinstalovat na čistý Ubuntu bez CUDA.

Kolik VRAM dostanu?

Na GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Plány s více GPU hodnoty sčítají – plán 4× A100 má celkem 320 GB VRAM. V přehledu plánů výše je systémová RAM uvedena zvlášť.

Mohu na VPS s GPU spustit Stable Diffusion / Llama / Whisper?

Ano. Plán 1× RTX 4090 je dobrý výchozí bod: VRAM postačuje pro inferenci SDXL, Llama 3 70B (4-bit kvantizace) nebo Whisper Large. Přejděte na RTX 5090 nebo A100, pokud potřebujete spouštět nekvatizované modely 70B nebo trénovat LoRA.

Jak se ceny srovnávají s AWS / Google Cloud / Lambda Labs?

Pro stabilní zátěž jsme obecně levnější. Nerozlišujeme ceny pro "on-demand" a "spot" a neúčtujeme poplatky za odchozí provoz. Čísla konkurence neuvádíme – ta se mění každý měsíc. Se 14denní zárukou vrácení peněz si nás jednoduše porovnáte s nynějším poskytovatelem na vlastních benchmarcích.

Je k dispozici roční sleva?

Ano, 35 % při ročním předplatném na každý plán s GPU (méně než 50 % u běžných CPU, protože hardware GPU se amortizuje déle). Bez automatického obnovení – před každým ročním cyklem dostanete fakturu, takže můžete plán snížit, navýšit nebo zrušit bez neočekávaných poplatků.

A co síť? Je to opravdu 40 Gbps?

Ano. Stejné 40 Gbps uplinky jako u našich vlajkových Cloud VPS, bez poplatků za odchozí provoz až do měsíčního limitu přenosu daného plánem. Hodí se při přesouvání velkých datových sad do GPU uzlu i z něj – model o velikosti 100 GB Hugging Face stáhnete na plné rychlosti přibližně za 30 sekund.

Mohu provozovat trénink na více uzlech (více VPS s GPU najednou)?

Ano, v rámci jedné oblasti. VPS ve stejném datacentru sdílejí lokální síť s latencí pod milisekundu. InfiniBand propojení momentálně nenabízíme – trénink na více uzlech přes standardní Ethernet bez problémů zvládne fine-tuning a menší distribuované úlohy, ale s bare-metal HPC pro rozsáhlé předtrénování se měřit nemůže.

Platí na plány s GPU záruka vrácení peněz?

14 dní, bez otázek. Vrácení peněz proběhne v rámci jednoho fakturačního cyklu. Máte dost času otestovat propustnost CUDA, spustit reálný tréninkový krok a rozhodnout, jestli je Cloudzy pro vaši zátěž ta pravá volba.

Přestaňte přeplácet hyperscalery.
Trénujte na dedikovaných GPU.

Vyberte kartu, vyberte oblast, klikněte. CUDA je předinstalována.