Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

Хостинг GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Виділений, не розділений.

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

Повний прохід GPU. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN і PyTorch встановлені заздалегідь.
NVMe + мережа 40 Gbps. Незалежний хмарний провайдер з 2008 року.

4.6 · 728 reviews on Trustpilot

Розгорнути GPU VPS Порівняти плани GPU

Починаючи з $506.35/mo · 35% знижки при річній оплаті · Без кредитної картки

~ ssh root@gpu-train-001 підключено

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS: короткий огляд

Cloudzy пропонує плани GPU VPS з виділеними RTX 6000 Pro, Nvidia A100, RTX 5090, та RTX 4090 карти в від 1× до 4× конфігурації, починаючи з $506.35 per month. Кожен план поставляється з попередньо встановленими останніми версіями CUDA, cuDNN та драйверів Nvidia, працює на AMD EPYC + DDR5 з Лише NVMe сховище та 40 Gbps каналами зв'язку і розгортається за 60 секунд. GPU — це повний апаратний доступ, без vGPU, без MIG, без спільного використання. Cloudzy працює незалежно з 2008 і оцінюється 4.6 / 5 by 728+ reviewers на Trustpilot.

Стартова ціна: $506.35 / mo
Типи GPU: 6000 Pro · A100 · 5090 · 4090
Конфігурації: від 1× до 4×
CUDA: Попередньо встановлено
Річна знижка: Знижка 35%
Повернення грошей: 14 днів

Чому ML-команди обирають Cloudzy

GPU-обчислення, цікавий спосіб.

Чотири причини, через які команди переходять до Cloudzy з AWS / GCP / гіпермасштабних GPU.

Виділений GPU із прямим доступом

Вся фізична карта — ваша: ніякого vGPU, ніяких MIG-розділів, ніякої конкуренції з іншими орендарями. CUDA-ядра, VRAM, PCIe-лінії — все виділено вам.

Образи з підтримкою CUDA

Драйвери Nvidia, CUDA toolkit і cuDNN уже вбудовані в образ Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install — і ви вже тренуєте модель.

NVMe + 40 Gbps

Чисте NVMe-сховище, щоб завантаження датасетів не ставало вузьким місцем. Мережа 40 Gbps означає, що модель Hugging Face розміром 100 GB завантажиться за секунди, а не хвилини.

цілодобова підтримка людини

Справжні інженери в чаті. Ми допомогли достатній кількості команд налаштувати багато-GPU навчання, відлагодити CUDA OOM-помилки та оптимізувати Llama inference — тому відповіді приходять швидко.

Лінійка GPU

Чотири сім'ї.
Дев'ять варіантів масштабування.

RTX 6000 Pro для висококласного inference та рендерингу з 48 GB ECC VRAM. A100 для навчання та навантажень з великим VRAM. RTX 5090 для найновішого inference. RTX 4090 для економічного inference моделей до 70B (4-bit). Доступні плани з кількома GPU — обирайте залежно від потреб у VRAM.

Повний прямий доступ до GPU, без розподілу та спільного використання

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

від 1× до 4× GPU

Доступні плани з кількома GPU

CUDA попередньо встановлений

PyTorch · TF · JAX готові

Чистий NVMe

Швидкий I/O набору даних

40 Gbps uplink

Витягніть моделі розміром 100 GB за 30 сек

Випадки використання

Завдання, з якими наші
клієнти реально працюють.

Висновок LLM

Запускайте Llama 3, Mistral, DeepSeek або Qwen через vLLM або Text Generation Inference. RTX 4090 справляється з 70B у 4-бітному квантуванні, RTX 5090 — з 70B у 8-бітному, A100 — з неквантованими моделями.

Stable Diffusion · генерація зображень

Запускайте SDXL, Flux або дообчені Stable Diffusion checkpoint'и з ComfyUI або Automatic1111. RTX 4090 видає 30+ зображень/хв для стандартного SDXL у роздільній здатності 1024×1024.

ML-тренування та дообчення

LoRA, QLoRA, повне дообчення. A100 — оптимальний варіант для неквантованого дообчення моделей 7B-13B; 4× A100 справляється з моделями до 70B при правильному шардингу (FSDP / DeepSpeed).

Тривимірний рендеринг · Blender

Cycles + OptiX на RTX-картах — найшвидший варіант для анімаційних студій. 24 GB VRAM на RTX 4090 покриває переважну більшість продакшн-сцен у рендерингу одного кадру.

Пайплайни для мовлення та відео

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Навіть план RTX 4090 забезпечує інференс у реальному часі для цих моделей із запасом ресурсів.

Тривалі батчеві завдання

Генерація ембедингів, пошукові пайплайни, препроцесинг датасетів. Платіть погодинно: запустіть завдання, збережіть знімок результату, видаліть сервер — виходить дешевше, ніж орендувати аналогічну потужність на AWS/GCP.

80 GB

A100 VRAM

40 Gbps

Висхідна лінія зв'язку

CUDA-готовий

Зображення

4 ×

Макс. GPU

35%

Річна знижка

14 днів

Повернення грошей

Ціноутворення

Поширені запитання, прямі відповіді.

Які GPU пропонує Cloudzy?

Чотири лінійки: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, про-рівень для інференсу та рендерингу), Nvidia A100 (1× / 2× / 4×, для ML-тренування, навантажень fp16/bf16 та 80 GB HBM2e на карту), RTX 5090 (1× / 2×, нова архітектура Blackwell, оптимально для інференсу та рендерингу) та RTX 4090 (1× / 2× / 4×, економічний варіант для Stable Diffusion, інференсу LLM та 3D-рендерингу).

GPU виділені чи спільні?

Виділені. Кожен план надає повний доступ до фізичного GPU(s) — без поділу, без vGPU, без MIG. CUDA-ядра, VRAM, пропускна здатність PCIe — все ваше. У мульти-GPU планах використовується NVLink там, де це підтримує фізичне залізо (мульти-GPU плани з A100).

Чи CUDA вже встановлена?

Так. Кожен GPU VPS постачається з найновішою стабільною версією CUDA toolkit, cuDNN та драйверами Nvidia, вже вбудованими в образ Ubuntu. PyTorch, TensorFlow, JAX та стек Hugging Face готові до роботи одразу. За бажанням можна перевстановити чистий образ Ubuntu без CUDA й самостійно вибрати потрібну версію.

Скільки VRAM я отримую?

На GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. У багато-GPU планах обсяги підсумовуються: план із 4× A100 має 320 GB загальної VRAM. У списку планів вище системна RAM вказана окремо.

Чи можна запускати Stable Diffusion / Llama / Whisper на VPS із GPU?

Так. План із 1× RTX 4090 - хороша відправна точка: VRAM вистачає для інференсу SDXL, Llama 3 70B (4-бітна квантизація) або Whisper Large. Переходьте на RTX 5090 або A100, якщо потрібно запускати неквантизовані моделі 70B або тренувати LoRA.

Як ціни порівнюються з AWS / Google Cloud / Lambda Labs?

Для постійних навантажень, як правило, дешевше. Ми не розділяємо ціни на «on-demand» і «spot» і не стягуємо плату за трафік. Порівнювати конкретні цифри конкурентів не будемо - вони змінюються щомісяця. 14-денна гарантія повернення коштів дозволяє протестувати нас поруч із поточним провайдером на власних бенчмарках.

Чи є знижка при річній оплаті?

Так, 35% знижки на річну оплату для кожного плану з GPU (менше, ніж 50% на звичайні CPU, бо амортизація GPU-заліза дорожча). Автопродовження немає: перед початком кожного річного циклу ви отримаєте рахунок і зможете перейти на інший план або скасувати підписку без жодних несподіваних списань.

А що з мережею? Справді 40 Gbps?

Так. Ті самі 40 Gbps аплінки, що й у наших флагманських Cloud VPS, без плати за вихідний трафік у межах місячного ліміту плану. Зручно для завантаження та вивантаження великих датасетів: модель на 100 GB типу Hugging Face завантажується приблизно за 30 секунд на повній швидкості лінії.

Чи можна запускати багатовузлове тренування (кілька VPS із GPU разом)?

Так, у межах одного регіону. VPS в одному дата-центрі використовують локальну мережу із затримкою менше мілісекунди. InfiniBand-з'єднання ми зараз не пропонуємо; багатовузлове тренування через стандартний Ethernet цілком підходить для файнтюнінгу та невеликих розподілених задач, але не конкурує з bare-metal HPC для великого попереднього тренування.

Чи є гарантія повернення коштів для планів із GPU?

14 днів без зайвих запитань. Повернення коштів протягом одного платіжного циклу. Цього достатньо, щоб виміряти пропускну здатність CUDA, запустити реальний крок тренування і зрозуміти, чи підходить Cloudzy для вашого навантаження.

Припиніть переплачувати хмарним гігантам.
Тренуйте моделі на виділених GPU.

Оберіть карту, оберіть регіон, натисніть. CUDA вже встановлено.