Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

Хостинг GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Выделенные ресурсы, без дробления.

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

Полный проброс GPU. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN и PyTorch предустановлены.
NVMe + сеть 40 Gbps. Независимое облако с 2008 года.

4.6 · 728 reviews on Trustpilot

Развернуть GPU VPS Сравнить тарифы GPU

От $506.35/mo · скидка 35% при оплате за год · Карта не нужна

~ ssh root@gpu-train-001 подключено

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS: коротко о главном

Cloudzy продаёт тарифы GPU VPS с выделенными RTX 6000 Pro, Nvidia A100, RTX 5090, и RTX 4090 карт в конфигурациях 1× до 4× начиная от $506.35 per month. Каждый тариф поставляется с предустановленными последними версиями CUDA, cuDNN и драйверами Nvidia, работает на AMD EPYC + DDR5 с Только NVMe хранилище и 40 Gbps аплинками и запускается за 60 секунд. GPU — выделенный проброс, без vGPU, без MIG, без разделения ресурсов. Cloudzy работает независимо с 2008 и имеет оценку 4.6 / 5 by 728+ reviewers на Trustpilot.

Начальная цена: $506.35 / mo
типы GPU: 6000 Pro · A100 · 5090 · 4090
Конфигурации: 1× до 4×
CUDA: Предустановлен
Скидка за год: Скидка 35%
Возврат средств: 14 дней

Почему ML-команды выбирают Cloudzy

GPU вычисления без скуки.

Четыре причины, по которым команды переходят на Cloudzy с AWS / GCP / облачных GPU гипершкейлеров.

Выделенный проброс GPU

Вся физическая карта — ваша: никакого нарезания vGPU, никаких MIG-разделов, никакой конкуренции с другими арендаторами. CUDA-ядра, VRAM, линии PCIe — всё выделено вам.

Образы с поддержкой CUDA

Свежие драйверы Nvidia, CUDA toolkit и cuDNN уже встроены в образ Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install — и можно обучать.

NVMe + 40 Gbps

Чистое NVMe-хранилище, чтобы загрузка датасетов не становилась узким местом. 40 Gbps сети — и скачивание модели Hugging Face на 100 GB займёт секунды, а не минуты.

Поддержка 24/7 с живыми людьми

Живые инженеры в чате. Мы помогли достаточно команд настроить многокарточное обучение, разобраться с CUDA OOM и оптимизировать инференс Llama — ответы приходят быстро.

Линейка GPU

Четыре семейства.
Девять вариантов масштабирования.

RTX 6000 Pro — для профессионального инференса и рендеринга с 48 GB ECC VRAM. A100 — для обучения и задач с большим объёмом VRAM. RTX 5090 — для новейшего инференса. RTX 4090 — для экономичного инференса моделей до 70B (4-бит). Доступны многокарточные планы — выбирайте под ваш бюджет VRAM.

Полный проброс GPU — без нарезки, без совместного использования

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

от 1× до 4× GPU

Доступны многокарточные планы

CUDA предустановлена

PyTorch · TF · JAX готовы к работе

Чистый NVMe

Быстрый набор данных I/O

40 Gbps uplink

Загрузка моделей 100 GB за 30 секунд

Сценарии использования

Задачи, с которыми работают наши
клиенты на практике.

Инференс LLM

Запускайте Llama 3, Mistral, DeepSeek или Qwen через vLLM или Text Generation Inference. RTX 4090 справляется с 70B при 4-битном квантовании, RTX 5090 — с 70B при 8-битном, A100 — без квантования.

Stable Diffusion · генерация изображений

Запускайте SDXL, Flux или дообученные чекпоинты Stable Diffusion через ComfyUI или Automatic1111. RTX 4090 выдаёт 30+ изображений/мин при стандартном разрешении 1024×1024 в SDXL.

Обучение ML и дообучение

LoRA, QLoRA, полное дообучение. A100 — оптимальный вариант для дообучения 7B–13B без квантования; 4× A100 справляется с моделями до 70B при правильном шардировании (FSDP / DeepSpeed).

3D-рендеринг · Blender

Cycles + OptiX на RTX-картах — быстрейший путь для анимационных студий. 24 GB VRAM на RTX 4090 покрывает подавляющее большинство производственных сцен с одиночным кадром.

Пайплайны речи и компьютерного зрения

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Даже план RTX 4090 обеспечивает инференс в реальном времени для этих моделей с запасом по ресурсам.

Долгие пакетные задачи

Генерация эмбеддингов, retrieval-пайплайны, предобработка датасетов. Платите почасово: запустите задачу, сделайте снапшот результата, удалите машину — выйдет дешевле, чем арендовать аналогичные мощности на AWS/GCP.

80 GB

A100 VRAM

40 Gbps

Канал связи

Готово к работе с CUDA

Образ

4 ×

Макс. GPU

35%

Скидка при оплате за год

14 дней

Возврат средств

Тарифы

Частые вопросы, прямые ответы.

Какие GPU предлагает Cloudzy?

Четыре линейки: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, профессиональный уровень для инференса и рендеринга), Nvidia A100 (1× / 2× / 4×, для обучения ML-моделей, вычислений fp16/bf16, 80 GB HBM2e на карту), RTX 5090 (1× / 2×, архитектура Blackwell нового поколения, оптимально для инференса и рендеринга), и RTX 4090 (1× / 2× / 4×, выгодный вариант для Stable Diffusion, инференса LLM и 3D-рендеринга).

GPU выделенные или разделяемые?

Выделенные. Каждый тариф даёт прямой доступ к физическому GPU целиком, без разделения, без vGPU, без MIG. CUDA-ядра, VRAM, пропускная способность PCIe — всё ваше. В мультикарточных тарифах используется NVLink там, где это поддерживает физическое железо (мультикарточные конфигурации A100).

CUDA предустановлена?

Да. Каждый GPU VPS поставляется с последней стабильной версией CUDA toolkit, cuDNN и драйверами Nvidia, уже встроенными в образ Ubuntu. PyTorch, TensorFlow, JAX и стек Hugging Face готовы к работе сразу. При необходимости можно переустановить чистый образ Ubuntu без CUDA и поставить нужную версию вручную.

Сколько VRAM доступно?

На карту: RTX 6000 Pro — 48 GB GDDR6 ECC, A100 — 80 GB HBM2e, RTX 5090 — 32 GB GDDR7, RTX 4090 — 24 GB GDDR6X. В мультикарточных тарифах объём суммируется: тариф 4× A100 даёт 320 GB VRAM суммарно. Объём системной RAM указан в таблице тарифов отдельно.

Можно ли запустить Stable Diffusion / Llama / Whisper на GPU VPS?

Да. Тариф 1× RTX 4090 — хорошая отправная точка: VRAM хватает для инференса SDXL, Llama 3 70B (4-bit квантизация) или Whisper Large. Для неквантизованных моделей 70B или обучения LoRA стоит взять RTX 5090 или A100.

Как цены соотносятся с AWS / Google Cloud / Lambda Labs?

Для стабильных нагрузок мы, как правило, дешевле: у нас нет разделения на «по запросу» и «спот», и мы не берём плату за исходящий трафик. Цифры конкурентов не приводим — они меняются каждый месяц. Гарантия возврата денег в течение 14 дней позволяет сравнить нас с текущим провайдером на своих собственных бенчмарках.

Есть ли скидка при оплате на год?

Да, 35% при годовой оплате на все планы GPU (меньше, чем 50% на обычные планы CPU, потому что амортизация оборудования GPU выше). Автопродления нет: перед каждым новым годовым циклом вы получите счёт и сможете перейти на другой план или отменить подписку без неожиданных списаний.

Как насчёт сети? Действительно 40 Gbps?

Да. Те же аплинки 40 Gbps, что и на наших флагманских серверах Cloud VPS, без платы за исходящий трафик в пределах месячного лимита плана. Это удобно для перемещения больших датасетов: загрузка модели Hugging Face весом 100 GB занимает около 30 секунд на максимальной скорости.

Можно ли запустить распределённое обучение на нескольких GPU VPS?

Да, в пределах одного региона. VPS в одном датацентре работают в общей локальной сети с задержкой менее миллисекунды. InfiniBand-интерконнект мы пока не предлагаем: распределённое обучение по стандартному Ethernet подходит для дообучения и небольших распределённых задач, но не конкурирует с bare-metal HPC для масштабного предобучения.

Действует ли гарантия возврата на планы GPU?

14 дней, без лишних вопросов. Возврат в течение одного расчётного периода. Этого вполне достаточно, чтобы проверить пропускную способность CUDA, прогнать реальный шаг обучения и понять, подходит ли Cloudzy для вашей задачи.

Перестаньте платить по ценам гипермасштабируемых облаков.
Обучайте модели на выделенных GPU.

Выберите карту, выберите регион, нажмите кнопку. CUDA уже установлен.