Скидка 50% на все тарифы, ограниченное время. От $2.48/mo

Хостинг GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Выделенные ресурсы, без дробления.

Полный проброс GPU. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN и PyTorch предустановлены.
NVMe + сеть 40 Gbps. Независимое облако с 2008 года.

4.6 · 728 reviews on Trustpilot

От $506.35/mo · скидка 35% при оплате за год · Карта не нужна

~ ssh root@gpu-train-001 подключено
root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS: коротко о главном

Cloudzy продаёт тарифы GPU VPS с выделенными RTX 6000 Pro, Nvidia A100, RTX 5090, и RTX 4090 карт в конфигурациях 1× до 4× начиная от $506.35 per month. Каждый тариф поставляется с предустановленными последними версиями CUDA, cuDNN и драйверами Nvidia, работает на AMD EPYC + DDR5 с Только NVMe хранилище и 40 Gbps аплинками и запускается за 60 секунд. GPU — выделенный проброс, без vGPU, без MIG, без разделения ресурсов. Cloudzy работает независимо с 2008 и имеет оценку 4.6 / 5 by 728+ reviewers на Trustpilot.

Начальная цена
$506.35 / mo
типы GPU
6000 Pro · A100 · 5090 · 4090
Конфигурации
1× до 4×
CUDA
Предустановлен
Скидка за год
Скидка 35%
Возврат средств
14 дней

Почему ML-команды выбирают Cloudzy

GPU вычисления без скуки.

Четыре причины, по которым команды переходят на Cloudzy с AWS / GCP / облачных GPU гипершкейлеров.

Выделенный проброс GPU

Вся физическая карта — ваша: никакого нарезания vGPU, никаких MIG-разделов, никакой конкуренции с другими арендаторами. CUDA-ядра, VRAM, линии PCIe — всё выделено вам.

Образы с поддержкой CUDA

Свежие драйверы Nvidia, CUDA toolkit и cuDNN уже встроены в образ Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install — и можно обучать.

NVMe + 40 Gbps

Чистое NVMe-хранилище, чтобы загрузка датасетов не становилась узким местом. 40 Gbps сети — и скачивание модели Hugging Face на 100 GB займёт секунды, а не минуты.

Поддержка 24/7 с живыми людьми

Живые инженеры в чате. Мы помогли достаточно команд настроить многокарточное обучение, разобраться с CUDA OOM и оптимизировать инференс Llama — ответы приходят быстро.

Линейка GPU

Четыре семейства.
Девять вариантов масштабирования.

RTX 6000 Pro — для профессионального инференса и рендеринга с 48 GB ECC VRAM. A100 — для обучения и задач с большим объёмом VRAM. RTX 5090 — для новейшего инференса. RTX 4090 — для экономичного инференса моделей до 70B (4-бит). Доступны многокарточные планы — выбирайте под ваш бюджет VRAM.

Полный проброс GPU — без нарезки, без совместного использования
RTX 6000 Pro
48 GB GDDR6 ECC · Pro-grade
Nvidia A100
80 GB HBM2e · ML training
RTX 5090
32 GB GDDR7 · Blackwell
RTX 4090
24 GB GDDR6X · cost-effective
от 1× до 4× GPU
Доступны многокарточные планы
CUDA предустановлена
PyTorch · TF · JAX готовы к работе
Чистый NVMe
Быстрый набор данных I/O
40 Gbps uplink
Загрузка моделей 100 GB за 30 секунд

Сценарии использования

Задачи, с которыми работают наши
клиенты на практике.

Инференс LLM

Запускайте Llama 3, Mistral, DeepSeek или Qwen через vLLM или Text Generation Inference. RTX 4090 справляется с 70B при 4-битном квантовании, RTX 5090 — с 70B при 8-битном, A100 — без квантования.

Stable Diffusion · генерация изображений

Запускайте SDXL, Flux или дообученные чекпоинты Stable Diffusion через ComfyUI или Automatic1111. RTX 4090 выдаёт 30+ изображений/мин при стандартном разрешении 1024×1024 в SDXL.

Обучение ML и дообучение

LoRA, QLoRA, полное дообучение. A100 — оптимальный вариант для дообучения 7B–13B без квантования; 4× A100 справляется с моделями до 70B при правильном шардировании (FSDP / DeepSpeed).

3D-рендеринг · Blender

Cycles + OptiX на RTX-картах — быстрейший путь для анимационных студий. 24 GB VRAM на RTX 4090 покрывает подавляющее большинство производственных сцен с одиночным кадром.

Пайплайны речи и компьютерного зрения

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Даже план RTX 4090 обеспечивает инференс в реальном времени для этих моделей с запасом по ресурсам.

Долгие пакетные задачи

Генерация эмбеддингов, retrieval-пайплайны, предобработка датасетов. Платите почасово: запустите задачу, сделайте снапшот результата, удалите машину — выйдет дешевле, чем арендовать аналогичные мощности на AWS/GCP.

80 GB
A100 VRAM
40 Gbps
Канал связи
Готово к работе с CUDA
Образ
4 ×
Макс. GPU
35%
Скидка при оплате за год
14 дней
Возврат средств

Тарифы

Популярные планы GPU. Почасовая или годовая оплата.

Годовая оплата сейчас Скидка 35% на каждом плане GPU.

Часто задаваемые вопросы. GPU VPS

Частые вопросы, прямые ответы.

Какие GPU предлагает Cloudzy?

Четыре линейки: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, профессиональный уровень для инференса и рендеринга), Nvidia A100 (1× / 2× / 4×, для обучения ML-моделей, вычислений fp16/bf16, 80 GB HBM2e на карту), RTX 5090 (1× / 2×, архитектура Blackwell нового поколения, оптимально для инференса и рендеринга), и RTX 4090 (1× / 2× / 4×, выгодный вариант для Stable Diffusion, инференса LLM и 3D-рендеринга).

GPU выделенные или разделяемые?

Выделенные. Каждый тариф даёт прямой доступ к физическому GPU целиком, без разделения, без vGPU, без MIG. CUDA-ядра, VRAM, пропускная способность PCIe — всё ваше. В мультикарточных тарифах используется NVLink там, где это поддерживает физическое железо (мультикарточные конфигурации A100).

CUDA предустановлена?

Да. Каждый GPU VPS поставляется с последней стабильной версией CUDA toolkit, cuDNN и драйверами Nvidia, уже встроенными в образ Ubuntu. PyTorch, TensorFlow, JAX и стек Hugging Face готовы к работе сразу. При необходимости можно переустановить чистый образ Ubuntu без CUDA и поставить нужную версию вручную.

Сколько VRAM доступно?

На карту: RTX 6000 Pro — 48 GB GDDR6 ECC, A100 — 80 GB HBM2e, RTX 5090 — 32 GB GDDR7, RTX 4090 — 24 GB GDDR6X. В мультикарточных тарифах объём суммируется: тариф 4× A100 даёт 320 GB VRAM суммарно. Объём системной RAM указан в таблице тарифов отдельно.

Можно ли запустить Stable Diffusion / Llama / Whisper на GPU VPS?

Да. Тариф 1× RTX 4090 — хорошая отправная точка: VRAM хватает для инференса SDXL, Llama 3 70B (4-bit квантизация) или Whisper Large. Для неквантизованных моделей 70B или обучения LoRA стоит взять RTX 5090 или A100.

Как цены соотносятся с AWS / Google Cloud / Lambda Labs?

Для стабильных нагрузок мы, как правило, дешевле: у нас нет разделения на «по запросу» и «спот», и мы не берём плату за исходящий трафик. Цифры конкурентов не приводим — они меняются каждый месяц. Гарантия возврата денег в течение 14 дней позволяет сравнить нас с текущим провайдером на своих собственных бенчмарках.

Есть ли скидка при оплате на год?

Да, 35% при годовой оплате на все планы GPU (меньше, чем 50% на обычные планы CPU, потому что амортизация оборудования GPU выше). Автопродления нет: перед каждым новым годовым циклом вы получите счёт и сможете перейти на другой план или отменить подписку без неожиданных списаний.

Как насчёт сети? Действительно 40 Gbps?

Да. Те же аплинки 40 Gbps, что и на наших флагманских серверах Cloud VPS, без платы за исходящий трафик в пределах месячного лимита плана. Это удобно для перемещения больших датасетов: загрузка модели Hugging Face весом 100 GB занимает около 30 секунд на максимальной скорости.

Можно ли запустить распределённое обучение на нескольких GPU VPS?

Да, в пределах одного региона. VPS в одном датацентре работают в общей локальной сети с задержкой менее миллисекунды. InfiniBand-интерконнект мы пока не предлагаем: распределённое обучение по стандартному Ethernet подходит для дообучения и небольших распределённых задач, но не конкурирует с bare-metal HPC для масштабного предобучения.

Действует ли гарантия возврата на планы GPU?

14 дней, без лишних вопросов. Возврат в течение одного расчётного периода. Этого вполне достаточно, чтобы проверить пропускную способность CUDA, прогнать реальный шаг обучения и понять, подходит ли Cloudzy для вашей задачи.

Перестаньте платить по ценам гипермасштабируемых облаков.
Обучайте модели на выделенных GPU.

Выберите карту, выберите регион, нажмите кнопку. CUDA уже установлен.

Без банковской карты · Гарантия возврата денег в течение 14 дней · Отмена в любой момент