Знижка 50% усі тарифи, обмежений час. Починаючи від $2.48/mo

Хостинг GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Виділений, не розділений.

Повний прохід GPU. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN і PyTorch встановлені заздалегідь.
NVMe + мережа 40 Gbps. Незалежний хмарний провайдер з 2008 року.

4.6 · 728 reviews on Trustpilot

Починаючи з $506.35/mo · 35% знижки при річній оплаті · Без кредитної картки

~ ssh root@gpu-train-001 підключено
root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS: короткий огляд

Cloudzy пропонує плани GPU VPS з виділеними RTX 6000 Pro, Nvidia A100, RTX 5090, та RTX 4090 карти в від 1× до 4× конфігурації, починаючи з $506.35 per month. Кожен план поставляється з попередньо встановленими останніми версіями CUDA, cuDNN та драйверів Nvidia, працює на AMD EPYC + DDR5 з Лише NVMe сховище та 40 Gbps каналами зв'язку і розгортається за 60 секунд. GPU — це повний апаратний доступ, без vGPU, без MIG, без спільного використання. Cloudzy працює незалежно з 2008 і оцінюється 4.6 / 5 by 728+ reviewers на Trustpilot.

Стартова ціна
$506.35 / mo
Типи GPU
6000 Pro · A100 · 5090 · 4090
Конфігурації
від 1× до 4×
CUDA
Попередньо встановлено
Річна знижка
Знижка 35%
Повернення грошей
14 днів

Чому ML-команди обирають Cloudzy

GPU-обчислення, цікавий спосіб.

Чотири причини, через які команди переходять до Cloudzy з AWS / GCP / гіпермасштабних GPU.

Виділений GPU із прямим доступом

Вся фізична карта — ваша: ніякого vGPU, ніяких MIG-розділів, ніякої конкуренції з іншими орендарями. CUDA-ядра, VRAM, PCIe-лінії — все виділено вам.

Образи з підтримкою CUDA

Драйвери Nvidia, CUDA toolkit і cuDNN уже вбудовані в образ Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install — і ви вже тренуєте модель.

NVMe + 40 Gbps

Чисте NVMe-сховище, щоб завантаження датасетів не ставало вузьким місцем. Мережа 40 Gbps означає, що модель Hugging Face розміром 100 GB завантажиться за секунди, а не хвилини.

цілодобова підтримка людини

Справжні інженери в чаті. Ми допомогли достатній кількості команд налаштувати багато-GPU навчання, відлагодити CUDA OOM-помилки та оптимізувати Llama inference — тому відповіді приходять швидко.

Лінійка GPU

Чотири сім'ї.
Дев'ять варіантів масштабування.

RTX 6000 Pro для висококласного inference та рендерингу з 48 GB ECC VRAM. A100 для навчання та навантажень з великим VRAM. RTX 5090 для найновішого inference. RTX 4090 для економічного inference моделей до 70B (4-bit). Доступні плани з кількома GPU — обирайте залежно від потреб у VRAM.

Повний прямий доступ до GPU, без розподілу та спільного використання
RTX 6000 Pro
48 GB GDDR6 ECC · Pro-grade
Nvidia A100
80 GB HBM2e · ML training
RTX 5090
32 GB GDDR7 · Blackwell
RTX 4090
24 GB GDDR6X · cost-effective
від 1× до 4× GPU
Доступні плани з кількома GPU
CUDA попередньо встановлений
PyTorch · TF · JAX готові
Чистий NVMe
Швидкий I/O набору даних
40 Gbps uplink
Витягніть моделі розміром 100 GB за 30 сек

Випадки використання

Завдання, з якими наші
клієнти реально працюють.

Висновок LLM

Запускайте Llama 3, Mistral, DeepSeek або Qwen через vLLM або Text Generation Inference. RTX 4090 справляється з 70B у 4-бітному квантуванні, RTX 5090 — з 70B у 8-бітному, A100 — з неквантованими моделями.

Stable Diffusion · генерація зображень

Запускайте SDXL, Flux або дообчені Stable Diffusion checkpoint'и з ComfyUI або Automatic1111. RTX 4090 видає 30+ зображень/хв для стандартного SDXL у роздільній здатності 1024×1024.

ML-тренування та дообчення

LoRA, QLoRA, повне дообчення. A100 — оптимальний варіант для неквантованого дообчення моделей 7B-13B; 4× A100 справляється з моделями до 70B при правильному шардингу (FSDP / DeepSpeed).

Тривимірний рендеринг · Blender

Cycles + OptiX на RTX-картах — найшвидший варіант для анімаційних студій. 24 GB VRAM на RTX 4090 покриває переважну більшість продакшн-сцен у рендерингу одного кадру.

Пайплайни для мовлення та відео

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Навіть план RTX 4090 забезпечує інференс у реальному часі для цих моделей із запасом ресурсів.

Тривалі батчеві завдання

Генерація ембедингів, пошукові пайплайни, препроцесинг датасетів. Платіть погодинно: запустіть завдання, збережіть знімок результату, видаліть сервер — виходить дешевше, ніж орендувати аналогічну потужність на AWS/GCP.

80 GB
A100 VRAM
40 Gbps
Висхідна лінія зв'язку
CUDA-готовий
Зображення
4 ×
Макс. GPU
35%
Річна знижка
14 днів
Повернення грошей

Ціноутворення

Рекомендовані плани GPU. Щогодинно або щорічно.

Зараз річна оплата Знижка 35% на кожному плані GPU.

Часто задавані питання. GPU VPS

Поширені запитання, прямі відповіді.

Які GPU пропонує Cloudzy?

Чотири лінійки: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, про-рівень для інференсу та рендерингу), Nvidia A100 (1× / 2× / 4×, для ML-тренування, навантажень fp16/bf16 та 80 GB HBM2e на карту), RTX 5090 (1× / 2×, нова архітектура Blackwell, оптимально для інференсу та рендерингу) та RTX 4090 (1× / 2× / 4×, економічний варіант для Stable Diffusion, інференсу LLM та 3D-рендерингу).

GPU виділені чи спільні?

Виділені. Кожен план надає повний доступ до фізичного GPU(s) — без поділу, без vGPU, без MIG. CUDA-ядра, VRAM, пропускна здатність PCIe — все ваше. У мульти-GPU планах використовується NVLink там, де це підтримує фізичне залізо (мульти-GPU плани з A100).

Чи CUDA вже встановлена?

Так. Кожен GPU VPS постачається з найновішою стабільною версією CUDA toolkit, cuDNN та драйверами Nvidia, вже вбудованими в образ Ubuntu. PyTorch, TensorFlow, JAX та стек Hugging Face готові до роботи одразу. За бажанням можна перевстановити чистий образ Ubuntu без CUDA й самостійно вибрати потрібну версію.

Скільки VRAM я отримую?

На GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. У багато-GPU планах обсяги підсумовуються: план із 4× A100 має 320 GB загальної VRAM. У списку планів вище системна RAM вказана окремо.

Чи можна запускати Stable Diffusion / Llama / Whisper на VPS із GPU?

Так. План із 1× RTX 4090 - хороша відправна точка: VRAM вистачає для інференсу SDXL, Llama 3 70B (4-бітна квантизація) або Whisper Large. Переходьте на RTX 5090 або A100, якщо потрібно запускати неквантизовані моделі 70B або тренувати LoRA.

Як ціни порівнюються з AWS / Google Cloud / Lambda Labs?

Для постійних навантажень, як правило, дешевше. Ми не розділяємо ціни на «on-demand» і «spot» і не стягуємо плату за трафік. Порівнювати конкретні цифри конкурентів не будемо - вони змінюються щомісяця. 14-денна гарантія повернення коштів дозволяє протестувати нас поруч із поточним провайдером на власних бенчмарках.

Чи є знижка при річній оплаті?

Так, 35% знижки на річну оплату для кожного плану з GPU (менше, ніж 50% на звичайні CPU, бо амортизація GPU-заліза дорожча). Автопродовження немає: перед початком кожного річного циклу ви отримаєте рахунок і зможете перейти на інший план або скасувати підписку без жодних несподіваних списань.

А що з мережею? Справді 40 Gbps?

Так. Ті самі 40 Gbps аплінки, що й у наших флагманських Cloud VPS, без плати за вихідний трафік у межах місячного ліміту плану. Зручно для завантаження та вивантаження великих датасетів: модель на 100 GB типу Hugging Face завантажується приблизно за 30 секунд на повній швидкості лінії.

Чи можна запускати багатовузлове тренування (кілька VPS із GPU разом)?

Так, у межах одного регіону. VPS в одному дата-центрі використовують локальну мережу із затримкою менше мілісекунди. InfiniBand-з'єднання ми зараз не пропонуємо; багатовузлове тренування через стандартний Ethernet цілком підходить для файнтюнінгу та невеликих розподілених задач, але не конкурує з bare-metal HPC для великого попереднього тренування.

Чи є гарантія повернення коштів для планів із GPU?

14 днів без зайвих запитань. Повернення коштів протягом одного платіжного циклу. Цього достатньо, щоб виміряти пропускну здатність CUDA, запустити реальний крок тренування і зрозуміти, чи підходить Cloudzy для вашого навантаження.

Припиніть переплачувати хмарним гігантам.
Тренуйте моделі на виділених GPU.

Оберіть карту, оберіть регіон, натисніть. CUDA вже встановлено.

Без кредитної картки · Повернення коштів протягом 14 днів · Скасування будь-коли