Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

GPU VPS Hosting

RTX 6000 Pro. A100. RTX 5090.
Dedikált, nem osztott.

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

Teljes GPU átvezetés. RTX 6000 Pro, A100, RTX 5090, RTX 4090. Előre telepített CUDA, cuDNN, PyTorch.
NVMe + 40 Gbps hálózat. Független felhőszolgáltató 2008 óta.

4.6 · 728 reviews on Trustpilot

Telepítés: GPU VPS GPU csomagok összehasonlítása

Kezdve $506.35/mo · 35% kedvezmény éves előfizetésnél · Bankkártya nem szükséges

~ ssh root@gpu-train-001 csatlakozva

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS egy pillantásra

Cloudzy GPU VPS csomagokat kínál dedikált RTX 6000 Pro, Nvidia A100, RTX 5090, és RTX 4090 kártyák a 1× – 4× konfigurációk, kezdve $506.35 per month. Minden csomag előre telepített, legfrissebb CUDA, cuDNN, és Nvidia driverekkel érkezik, AMD EPYC + DDR5 alapon fut, Csak NVMe tárolás és 40 Gbps uplink kapcsolattal, és perceken belül üzembe helyezhető 60 másodperc. A GPU-k dedikált passthrough megoldások, nem vGPU, nem MIG, nem megosztott. A Cloudzy független szolgáltatóként működik 2008 és értékelt 4.6 / 5 by 728+ reviewers a Trustpilot-on.

Kezdőár: $506.35 / mo
GPU típusok: 6000 Pro · A100 · 5090 · 4090
Konfigurációk: 1× – 4×
CUDA: Előre telepítve
Éves kedvezmény: 35% kedvezmény
Pénzvisszafizetés: 14 nap

Miért választják az ML csapatok a Cloudzy-t

GPU számítási kapacitás a unborított módon.

Négy ok, amiért a csapatok átváltanak a Cloudzy-ra a AWS / GCP / hyperscaler GPU-król.

Dedikált GPU passthrough

A teljes fizikai kártya a tiéd: nincs vGPU szeletelés, nincs MIG partíció, nincs más bérlőkkel való versengés. CUDA magok, VRAM, PCIe sávok mind dedikáltak.

CUDA-kész képek

A legfrissebb Nvidia driverek, CUDA toolkit és cuDNN előre integrálva az Ubuntu image-be. PyTorch, TensorFlow, JAX, Hugging Face, egy pip install, és máris taníthatod a modellt.

NVMe + 40 Gbps

Tiszta NVMe tárhely, hogy az adatbetöltés ne legyen szűk keresztmetszet. 40 Gbps hálózattal egy 100 GB-os Hugging Face modell letöltése másodpercek alatt megvan, nem percekig tart.

24/7 emberi támogatás

Valódi mérnökök a chaten. Elég csapatnak segítettük már a multi-GPU tanítás beállítását, CUDA OOM hibák debugolását és Llama inferencia hangolását ahhoz, hogy gyors választ kapj.

GPU termékcsalád

Négy család.
Kilenc lehetőség a skálázásra.

RTX 6000 Pro professzionális inferenciához és rendereléshez, 48 GB ECC VRAM-rel. A100 tanításhoz és nagy VRAM-igényű feladatokhoz. RTX 5090 a legújabb inferencia-munkálatokhoz. RTX 4090 költséghatékony inferenciához 70B paraméterig (4-bit). Multi-GPU csomagok is elérhetők, válaszd ki, amit a VRAM-korlátod megkíván.

Teljes GPU passthrough, nem szeletelve, nem megosztva

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

1× és 4× GPU között

Multi-GPU csomagok elérhetők

CUDA előtelepítve

PyTorch · TF · JAX kész

Tiszta NVMe

Gyors adatkészlet I/O

40 Gbps uplink

100 GB-os modelleket húzzon le 30 másodperc alatt

Felhasználási esetek

A munkaterhelések, amelyeket a mi
amelyen az ügyfelek valóban tanítanak.

LLM következtetés

Llama 3, Mistral, DeepSeek vagy Qwen kiszolgálása vLLM vagy Text Generation Inference segítségével. A RTX 4090 4 bites kvantálással kezeli a 70B-s modelleket, a RTX 5090 8 bites kvantálással, a A100 kvantálás nélkül.

Stable Diffusion · képgenerálás

Futtass SDXL-t, Flux-t vagy finomhangolt Stable Diffusion checkpointokat ComfyUI vagy Automatic1111 segítségével. A RTX 4090 standard 1024×1024-es SDXL generálásnál 30+ képet produkál percenként.

ML tanítás + finomhangolás

LoRA, QLoRA, teljes finomhangolás. A A100 az ideális választás 7B-13B-s, kvantálatlan modellek finomhangolásához; 4× A100 megfelelő shardolással (FSDP / DeepSpeed) akár 70B-s modelleket is kezel.

3D renderelés · Blender

A Cycles + OptiX RTX kártyákon a leggyorsabb megoldás animációs stúdiók számára. Az RTX 4090 plan 24 GB VRAM-je az egykockás gyártási jelenetek túlnyomó többségét lefedi.

Hang- és látórendszer-folyamatok

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Még az RTX 4090 plan is valós idejű inferenciát biztosít ezeken a modelleken, bőséges tartalékkapacitással.

Hosszan futó kötegelt feladatok

Embedding-generálás, visszakeresési folyamatok, adatkészlet-előfeldolgozás. Fizess óránként, futtasd a feladatot, mentsd el a kimenetet snapshotba, töröld a szervert. Ugyanakkora munkaterhelésnél olcsóbb, mint bérelni AWS/GCP-n.

80 GB

A100 VRAM

40 Gbps

Felfelé mutató kapcsolat

CUDA-ready

Kép

4 ×

Max GPU-k

35%

Éves kedvezmény

14 nap

Pénzvisszafizetés

Árazás

Kiemelt GPU csomagok. Óránkénti vagy éves.

Az éves számlázás jelenleg 35% kedvezmény minden GPU csomagnál.

Legnépszerűbb

1× RTX 6000 Pro

48 GB GDDR6 ECC VRAM

$845 /hó

$1300/mo -35%

Telepítés most

14 napos visszatérítési garancia

200 GB DDR5
24 vCPU
1.3 TB NVMe NVMe
20 TB · 40 Gbps
CUDA előtelepítve

Mind a 9 GPU csomag megtekintése (1× – 4× kártya)

GYIK. GPU VPS

Gyakori kérdések egyenes válaszok.

Milyen GPU-ket kínál a Cloudzy?

Négy típus: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, professzionális inferenciához és rendereléshez), Nvidia A100 (1× / 2× / 4×, ML tanításhoz, fp16/bf16 munkaterheléshez, kártyánként 80 GB HBM2e), RTX 5090 (1× / 2×, újabb Blackwell architektúra, inferenciához és rendereléshez ideális), valamint RTX 4090 (1× / 2× / 4×, költséghatékony Stable Diffusion-hez, LLM inferenciához és 3D rendereléshez).

A GPU-k dedikáltak vagy megosztottak?

Dedikáltak. Minden csomag a teljes fizikai GPU(ek) közvetlen átadása, nem szelet, nem vGPU, nem MIG. A CUDA magok, a VRAM, a PCIe sávszélesség, mind a tiéd. A több GPU-es csomagok NVLinket használnak, ahol a fizikai hardver ezt támogatja (A100 több GPU-es csomagok).

Előre telepített a CUDA?

Igen. Minden GPU VPS a legújabb stabil CUDA toolkit-kel, cuDNN-nel és Nvidia driverekkel érkezik, amelyek előre be vannak sütve a Ubuntu image-be. Az PyTorch, TensorFlow, JAX és a Hugging Face stack azonnal használatra kész. Ha egy adott verziót szeretnél telepíteni, újra is képezheted a szervert CUDA nélküli, tiszta Ubuntu-re.

Mennyi VRAM-t kapok?

GPU-enként: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Több GPU-es csomagoknál ez összeadódik; egy 4× A100 csomagnál összesen 320 GB VRAM áll rendelkezésre. A fenti csomaglista a rendszer RAM-jét külön tünteti fel.

Futtathatok Stable Diffusion-t / Llamát / Whisperi egy GPU VPS-en?

Igen. Az 1× RTX 4090-es csomag jó kiindulópont: elegendő VRAM-mal rendelkezik SDXL inferenciához, Llama 3 70B (4 bites kvantálással) vagy Whisper Large futtatásához. Válassz RTX 5090-et vagy A100-at, ha kvantálás nélküli 70B modelleket szeretnél futtatni, vagy LoRA-kat szeretnél tanítani.

Hogyan viszonyul az ár a AWS / Google Cloud / Lambda Labs árazásához?

Általánosságban olcsóbb az állandó terhelésekhez, nem különböztetünk meg az árak között az „igény szerinti" és a „spot" között, és nincsenek kimenő adatátviteli díjaink. Nem idézünk fel versenytársak számait (ezek havonta változnak). A 14 napos pénzvisszaadási garancia lehetővé teszi az A/B tesztelést jelenlegi szolgáltatóddal szemben a saját benchmarkjaid alapján.

Van éves kedvezmény?

Igen, az éves számlázás minden GPU csomagnál 35% kedvezményt jelent (ez alacsonyabb, mint a normál CPU esetében érvényes 50%, mivel az GPU hardver amortizációs költsége magasabb). Nincs automatikus megújítás; minden éves ciklus előtt számlát küldünk, így szabadon válthatsz kisebb vagy nagyobb csomagra, illetve lemondhatod a szolgáltatást – váratlan díjak nélkül.

Mi a helyzet a hálózattal? Valóban 40 Gbps-t kapok?

Igen. Ugyanolyan 40 Gbps uplink kapcsolatok, mint a prémium Cloud VPS esetén, és nincs kimenő forgalmi díj a havi keret eléréséig. Praktikus nagy adathalmazok mozgatásához: egy 100 GB-os Hugging Face modell letöltése az GPU csomópontra nagyjából 30 másodpercet vesz igénybe maximális sávszélességen.

Futtathatok több csomópontos tanítást (több GPU VPS együtt)?

Igen, régión belül. Az ugyanabban az adatközpontban lévő VPS példányok helyi hálózaton kommunikálnak, ezredmásodpercnél kisebb késéssel. InfiniBand összeköttetést jelenleg nem kínálunk – a szabványos Ethernet feletti többcsomópontos tanítás finomhangoláshoz és kisebb léptékű elosztott feladatokhoz megfelelő, de nagy előtanítási munkáknál nem veszi fel a versenyt a bare-metal HPC megoldásokkal.

Visszatérítési garancia az GPU csomagokra?

14 nap, feltételek nélkül. A visszatérítés egy számlázási cikluson belül történik. Elég idő arra, hogy bemérjük a CUDA-átviteli sebességet, lefuttassunk egy valódi tanítási lépést, és eldöntsük, hogy az Cloudzy illik-e a munkaterhelésünkhöz.

Hagyja abba a felhőóriások árain való fizetést.
Tréningeld dedikált GPU-ken.

Válassz kártyát, válassz régiót, kattints. A CUDA már telepítve van.