Sleva 50% všechny plány, časově omezená nabídka. Od $2.48/mo

Hostování GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Dedikovaný, ne sdílený.

Plný passthrough GPU. RTX 6000 Pro, A100, RTX 5090, RTX 4090. Předinstalováno: CUDA, cuDNN, PyTorch.
NVMe + 40 Gbps síť. Nezávislý cloud od roku 2008.

4.6 · 728 reviews on Trustpilot

Začínající na $506.35/mo · 35% sleva při roční platbě · Kreditní karta není nutná

~ ssh root@gpu-train-001 připojen
root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS na první pohled

Cloudzy prodává plány GPU VPS s dedikovaným RTX 6000 Pro, Nvidia A100, RTX 5090, a RTX 4090 karty v 1× až 4× konfigurace, začínající na $506.35 per month. Každý plán je dodáván s předinstalovanou nejnovější verzí CUDA, cuDNN, a ovladači Nvidia, běží na AMD EPYC + DDR5 s Pouze NVMe úložiště a 40 Gbps uplinky a je zprovozněn za 60 sekund. GPUs jsou dedikovaný passthrough, ne vGPU, ne MIG, ne sdílené. Cloudzy funguje nezávisle od roku 2008 a má hodnocení 4.6 / 5 by 728+ reviewers na Trustpilot.

Počáteční cena
$506.35 / mo
Typy GPU
6000 Pro · A100 · 5090 · 4090
Konfigurace
1× až 4×
CUDA
Předinstalovaný
Roční sleva
35% sleva
Vrácení peněz
14 dní

Proč si ML týmy vybírají Cloudzy

GPU výpočetní výkon pro zajímavým způsobem.

Čtyři důvody, proč týmy přecházejí k Cloudzy od AWS / GCP / hyperscaler GPU.

Dedikovaný passthrough GPU

Celá fyzická karta je jen vaše. Žádné dělení vGPU, žádné MIG oddíly, žádné sdílení s ostatními nájemci. CUDA jádra, VRAM, PCIe linky - vše dedikované.

CUDA-ready obrazy

Nejnovější ovladače Nvidia, CUDA toolkit a cuDNN jsou předem zahrnuty v obrazu Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install a trénování může začít.

NVMe + 40 Gbps

Čistý NVMe storage, takže načítání datasetu není úzké místo. 40 Gbps síť znamená, že stažení modelu Hugging Face o velikosti 100 GB trvá sekundy, ne minuty.

Lidská podpora 24/7

Skuteční inženýři v chatu. Pomohli jsme dostatečnému počtu týmů s nastavením trénování na více GPU, laděním CUDA OOM chyb a optimalizací Llama inference, takže odpovědi přicházejí rychle.

Řada GPU

Čtyři rodiny.
Devět způsobů, jak škálovat.

RTX 6000 Pro pro profesionální inference a rendering s 48 GB ECC VRAM. A100 pro trénování a úlohy s vysokými nároky na VRAM. RTX 5090 pro nejnovější inference. RTX 4090 pro cenově výhodnou inference modelů až 70B (4-bit). K dispozici jsou plány s více GPU - vyberte si podle svého VRAM rozpočtu.

Plný passthrough GPU, bez dělení, bez sdílení
RTX 6000 Pro
48 GB GDDR6 ECC · Pro-grade
Nvidia A100
80 GB HBM2e · ML training
RTX 5090
32 GB GDDR7 · Blackwell
RTX 4090
24 GB GDDR6X · cost-effective
1× až 4× GPU
Plány s více GPU k dispozici
CUDA předinstalován
PyTorch · TF · JAX připraveno
Čistý NVMe
Rychlý I/O datové sady
40 Gbps uplink
Stažení modelů o velikosti 100 GB za 30 sekund

Případy použití

Úlohy, které naši
zákazníci skutečně trénují.

Inference LLM

Nasaďte Llama 3, Mistral, DeepSeek nebo Qwen pomocí vLLM nebo Text Generation Inference. RTX 4090 zvládne 70B při 4-bit kvantizaci, RTX 5090 při 8-bit, A100 bez kvantizace.

Stable Diffusion · generování obrázků

Spusťte SDXL, Flux nebo doladěné checkpointy Stable Diffusion přes ComfyUI nebo Automatic1111. RTX 4090 dosáhne 30+ obrázků/min při standardním SDXL rozlišení 1024×1024.

ML trénování + doladění

LoRA, QLoRA, plné doladění. A100 je ideální volba pro 7B–13B bez kvantizace; 4× A100 zvládne až 70B při správném rozdělení (FSDP / DeepSpeed).

3D vykreslování · Blender

Cycles + OptiX na kartách RTX je nejrychlejší cesta pro animační studia. 24 GB VRAM na RTX 4090 pokryje naprostou většinu produkčních scén při renderování jediného snímku.

Pipelines pro řeč a obraz

Whisper Large, Faster-Whisper, YOLO, Segment Anything. I plán RTX 4090 zvládá inference těchto modelů v reálném čase s dostatečnou rezervou.

Dlouhé dávkové úlohy

Generování embeddingů, retrieval pipelines, předzpracování datasetů. Plaťte po hodinách: spusťte úlohu, uložte výstup jako snapshot, zrušte server. Vyjde to levněji než stejná úloha na AWS/GCP.

80 GB
A100 VRAM
40 Gbps
Spojení nahoru
CUDA-ready
Obrázek
4 ×
Maximální počet GPU
35%
Roční sleva
14 dní
Vrácení peněz

Ceny

Doporučené plány GPU. Hodinově nebo ročně.

Roční fakturace je momentálně 35% sleva u každého plánu GPU.

Často kladené otázky. GPU VPS

Běžné otázky, přímé odpovědi.

Které GPU nabízí Cloudzy?

Čtyři řady: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, profesionální úroveň pro inference a renderování), Nvidia A100 (1× / 2× / 4×, pro ML trénování, fp16/bf16 úlohy a 80 GB HBM2e na kartu), RTX 5090 (1× / 2×, novější architektura Blackwell, ideální pro inference a renderování) a RTX 4090 (1× / 2× / 4×, cenově dostupné pro Stable Diffusion, LLM inference a 3D renderování).

Jsou GPU dedikované, nebo sdílené?

Dedikované. Každý plán přiděluje celý fyzický GPU, ne jeho část, ne vGPU, ne MIG. CUDA jádra, VRAM, PCIe šířka pásma - to vše máte jen pro sebe. Plány s více GPU využívají NVLink tam, kde to fyzický hardware podporuje (plány s více A100).

Je CUDA předinstalována?

Ano. Každý GPU VPS se dodává s nejnovějším stabilním CUDA toolkitem, cuDNN a ovladači Nvidia předinstalovanými v obrazu Ubuntu. PyTorch, TensorFlow, JAX i stack Hugging Face jsou připraveny okamžitě k použití. Pokud potřebujete nainstalovat konkrétní verzi, lze obraz přeinstalovat na čistý Ubuntu bez CUDA.

Kolik VRAM dostanu?

Na GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Plány s více GPU hodnoty sčítají – plán 4× A100 má celkem 320 GB VRAM. V přehledu plánů výše je systémová RAM uvedena zvlášť.

Mohu na VPS s GPU spustit Stable Diffusion / Llama / Whisper?

Ano. Plán 1× RTX 4090 je dobrý výchozí bod: VRAM postačuje pro inferenci SDXL, Llama 3 70B (4-bit kvantizace) nebo Whisper Large. Přejděte na RTX 5090 nebo A100, pokud potřebujete spouštět nekvatizované modely 70B nebo trénovat LoRA.

Jak se ceny srovnávají s AWS / Google Cloud / Lambda Labs?

Pro stabilní zátěž jsme obecně levnější. Nerozlišujeme ceny pro "on-demand" a "spot" a neúčtujeme poplatky za odchozí provoz. Čísla konkurence neuvádíme – ta se mění každý měsíc. Se 14denní zárukou vrácení peněz si nás jednoduše porovnáte s nynějším poskytovatelem na vlastních benchmarcích.

Je k dispozici roční sleva?

Ano, 35 % při ročním předplatném na každý plán s GPU (méně než 50 % u běžných CPU, protože hardware GPU se amortizuje déle). Bez automatického obnovení – před každým ročním cyklem dostanete fakturu, takže můžete plán snížit, navýšit nebo zrušit bez neočekávaných poplatků.

A co síť? Je to opravdu 40 Gbps?

Ano. Stejné 40 Gbps uplinky jako u našich vlajkových Cloud VPS, bez poplatků za odchozí provoz až do měsíčního limitu přenosu daného plánem. Hodí se při přesouvání velkých datových sad do GPU uzlu i z něj – model o velikosti 100 GB Hugging Face stáhnete na plné rychlosti přibližně za 30 sekund.

Mohu provozovat trénink na více uzlech (více VPS s GPU najednou)?

Ano, v rámci jedné oblasti. VPS ve stejném datacentru sdílejí lokální síť s latencí pod milisekundu. InfiniBand propojení momentálně nenabízíme – trénink na více uzlech přes standardní Ethernet bez problémů zvládne fine-tuning a menší distribuované úlohy, ale s bare-metal HPC pro rozsáhlé předtrénování se měřit nemůže.

Platí na plány s GPU záruka vrácení peněz?

14 dní, bez otázek. Vrácení peněz proběhne v rámci jednoho fakturačního cyklu. Máte dost času otestovat propustnost CUDA, spustit reálný tréninkový krok a rozhodnout, jestli je Cloudzy pro vaši zátěž ta pravá volba.

Přestaňte přeplácet hyperscalery.
Trénujte na dedikovaných GPU.

Vyberte kartu, vyberte oblast, klikněte. CUDA je předinstalována.

Bez nutnosti platební karty · 14denní záruka vrácení peněz · Zrušení kdykoliv