50% zniżki wszystkie plany, oferta limitowana. Od $2.48/mo

Hosting GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Dedykowane zasoby, bez współdzielenia.

Pełny passthrough GPU. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN i PyTorch zainstalowane od razu.
NVMe + sieć 40 Gbps. Niezależna chmura od 2008 roku.

4.7 · 747 opinie na Trustpilot

Od $506.35/mo · 35% taniej przy płatności rocznej · Bez karty kredytowej

~ ssh root@gpu-train-001 połączony
root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS w skrócie

Cloudzy sprzedaje plany GPU VPS z dedykowanym RTX 6000 Pro, Nvidia A100, RTX 5090, oraz RTX 4090 karty w od 1× do 4× konfiguracje, począwszy od $506.35 per month. Każdy plan zawiera preinstalowaną najnowszą wersję CUDA, cuDNN oraz sterowniki Nvidia, działa na AMD EPYC + DDR5 z Tylko NVMe pamięć i 40 Gbps łączami i uruchamia się w 60 sekund. GPU to dedykowany passthrough - nie vGPU, nie MIG, nie współdzielony. Cloudzy działa niezależnie od 2008 i ma ocenę 4.7 / 5 by 747+ recenzentów na Trustpilot.

Cena początkowa
$506.35 / mo
Typy GPU
6000 Pro · A100 · 5090 · 4090
Konfiguracje
od 1× do 4×
CUDA
Wstępnie zainstalowany
Rabat roczny
35% rabatu
Zwrot pieniędzy
14 dni

Dlaczego zespoły ML wybierają Cloudzy

Obliczenia GPU dla nudny sposób.

Cztery powody, dla których zespoły przechodzą do Cloudzy z AWS / GCP lub hyperscalerów.

Dedykowany passthrough GPU

Fizyczna karta w całości należy do Ciebie - żadnego dzielenia na vGPU, żadnych partycji MIG, żadnej rywalizacji z innymi użytkownikami. Rdzenie CUDA, RAM, tory PCIe - wszystko dedykowane.

Obrazy gotowe do pracy z CUDA

Najnowsze sterowniki Nvidia, toolkit CUDA i cuDNN wbudowane w obraz Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install i możesz trenować.

NVMe + 40 Gbps

Czyste dyski NVMe, żeby ładowanie danych nie było wąskim gardłem. Sieć 40 Gbps oznacza, że pobranie modelu Hugging Face o rozmiarze 100 GB zajmuje sekundy, nie minuty.

Wsparcie ludzkie 24/7

Prawdziwi inżynierowie na czacie. Pomagaliśmy już wielu zespołom konfigurować trening na wielu GPU, debugować CUDA OOM i strojić inferencję Llama - odpowiedzi przychodzą szybko.

Linia GPU

Cztery rodziny.
Dziewięć sposobów na skalowanie.

RTX 6000 Pro do profesjonalnej inferencji i renderowania z 48 GB ECC RAM. A100 do trenowania i zadań wymagających dużej ilości RAM. RTX 5090 do najnowszych zastosowań inferencji. RTX 4090 do inferencji modeli do 70B (4-bit) w dobrej cenie. Dostępne plany z wieloma GPU - wybierz konfigurację dopasowaną do budżetu RAM.

Pełny passthrough GPU - bez dzielenia, bez współdzielenia
RTX 6000 Pro
48 GB GDDR6 ECC · Pro-grade
Nvidia A100
80 GB HBM2e · ML training
RTX 5090
32 GB GDDR7 · Blackwell
RTX 4090
24 GB GDDR6X · cost-effective
Od 1× do 4× GPU
Dostępne plany z wieloma GPU
CUDA wstępnie zainstalowany
PyTorch · TF · JAX gotowe do użycia
Czysty NVMe
Szybki zestaw danych I/O
40 Gbps uplink
Pobierz modele o rozmiarze 100 GB w 30 sekund

Przypadki użycia

Zadania, które nasi
klienci naprawdę trenują.

Wnioskowanie LLM

Uruchom Llama 3, Mistral, DeepSeek lub Qwen z vLLM lub Text Generation Inference. RTX 4090 obsługuje 70B przy kwantyzacji 4-bit, RTX 5090 obsługuje 70B przy 8-bit, A100 obsługuje wersje bez kwantyzacji.

Stable Diffusion · generowanie obrazów

Uruchom SDXL, Flux lub dostrojone checkpointy Stable Diffusion z ComfyUI lub Automatic1111. RTX 4090 osiąga ponad 30 obrazów/min dla standardowego SDXL w rozdzielczości 1024×1024.

Trening ML i fine-tuning

LoRA, QLoRA, pełny fine-tuning. A100 to najlepszy wybór do fine-tuningu modeli 7B-13B bez kwantyzacji; 4× A100 obsługuje do 70B przy odpowiednim shardingu (FSDP / DeepSpeed).

Renderowanie 3D · Blender

Cycles + OptiX na kartach RTX to najszybsza opcja dla studiów animacji. 24 GB VRAM w planie RTX 4090 pokrywa zdecydowaną większość produkcyjnych scen renderowanych w pojedynczej klatce.

Pipeliny speech + vision

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Nawet plan RTX 4090 uruchamia inferencję w czasie rzeczywistym na tych modelach, z wyraźnym zapasem mocy obliczeniowej.

Długotrwałe zadania wsadowe

Generowanie embeddingów, pipeliny retrieval, preprocessing danych. Płacisz za godzinę, uruchamiasz zadanie, robisz snapshot wyników, usuwasz maszynę - taniej niż wynajem na AWS/GCP przy tym samym obciążeniu.

80 GB
A100 VRAM
40 Gbps
Łącze wznoszące
Gotowy do CUDA
Obraz
4 ×
Maks GPU
35%
Rabat roczny
14 dni
Zwrot pieniędzy

Ceny

Polecane plany GPU. Godzinowo lub rocznie.

Rozliczanie roczne jest teraz 35% rabatu na każdym planie GPU.

Często zadawane pytania. GPU VPS

Częste pytania, konkretne odpowiedzi.

Jakie GPU oferuje Cloudzy?

Cztery rodziny: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, klasa profesjonalna do inferencji i renderowania), Nvidia A100 (1× / 2× / 4×, do treningu ML, obciążeń fp16/bf16 i 80 GB HBM2e na kartę), RTX 5090 (1× / 2×, nowsza architektura Blackwell, idealna do inferencji i renderowania) oraz RTX 4090 (1× / 2× / 4×, ekonomiczny wybór do Stable Diffusion, inferencji LLM i renderowania 3D).

Czy GPU są dedykowane czy współdzielone?

Dedykowane. Każdy plan to bezpośredni dostęp do pełnego fizycznego GPU - bez podziału na fragmenty, bez vGPU, bez MIG. Rdzenie CUDA, VRAM, przepustowość PCIe - wszystko do Twojej dyspozycji. Plany z wieloma GPU korzystają z NVLink tam, gdzie sprzęt to umożliwia (plany multi-GPU dla A100).

Czy CUDA jest zainstalowane z góry?

Tak. Każdy VPS GPU jest dostarczany z najnowszym stabilnym toolkitem CUDA, cuDNN i sterownikami Nvidia wbudowanymi w obraz Ubuntu. PyTorch, TensorFlow, JAX oraz stos Hugging Face są gotowe do użycia od razu. Możesz przywrócić czysty obraz Ubuntu bez CUDA, jeśli chcesz zainstalować konkretną wersję.

Ile VRAM otrzymuję?

Na GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Plany wieloGPU sumują te wartości - plan 4× A100 dysponuje łącznie 320 GB VRAM. Lista planów powyżej przedstawia RAM systemowy oddzielnie.

Czy mogę uruchomić Stable Diffusion / Llama / Whisper na GPU VPS?

Tak. Plan 1× RTX 4090 to dobry punkt wyjścia: wystarczająca VRAM do inferencji SDXL, Llama 3 70B (kwantyzacja 4-bitowa) czy Whisper Large. Przejdź na RTX 5090 lub A100, jeśli chcesz uruchamiać niekwantyzowane modele 70B albo trenować LoRA.

Jak ceny wypadają w porównaniu z AWS / Google Cloud / Lambda Labs?

Ogólnie tańsze dla stałych obciążeń pracą, nie stosujemy dyskryminacji cenowej między „on-demand" a „spot" i nie pobieramy opłat za transfer danych wychodzących. Nie będziemy cytować liczb konkurentów (zmieniają się co miesiąc). 14-dniowa gwarancja zwrotu pieniędzy pozwala na porównanie A/B z Twoim obecnym dostawcą przy użyciu Twoich własnych testów porównawczych.

Czy jest zniżka za roczny abonament?

Tak, każdy plan GPU w rozliczeniu rocznym jest tańszy o 35% (mniej niż 50% na standardowych planach CPU, bo sprzęt GPU jest droższy w amortyzacji). Bez automatycznego odnawiania - przed każdym kolejnym rokiem otrzymasz fakturę, dzięki czemu możesz obniżyć, podwyższyć lub anulować plan bez niespodziewanych opłat.

A co z siecią? Czy to naprawdę 40 Gbps?

Tak. Te same łącza 40 Gbps co w naszym flagowym Cloud VPS, bez opłat za ruch wychodzący w ramach miesięcznego limitu transferu. Przydaje się przy przesyłaniu dużych zbiorów danych do i z węzła GPU — pobranie modelu Hugging Face o rozmiarze 100 GB zajmuje około 30 sekund przy pełnej przepustowości łącza.

Czy mogę uruchomić trening wielowęzłowy (wiele GPU VPS jednocześnie)?

Tak, w obrębie tego samego regionu. VPS w tym samym centrum danych współdzielą sieć lokalną z opóźnieniem poniżej milisekundy. Obecnie nie oferujemy połączeń InfiniBand - trenowanie wielowęzłowe przez standardowy Ethernet sprawdza się przy fine-tuningu i rozproszonych zadaniach na małą skalę, ale nie dorównuje wydajnością bare-metal HPC przy dużym trenowaniu wstępnym.

Gwarancja zwrotu pieniędzy dla planów GPU?

14 dni, bez pytań. Zwrot środków w ciągu jednego cyklu rozliczeniowego. Wystarczająco dużo czasu, żeby sprawdzić przepustowość CUDA, uruchomić prawdziwy krok treningowy i ocenić, czy Cloudzy pasuje do Twojego obciążenia.

Przestań przepłacać za chmurę gigantów.
Trenuj na dedykowanych GPUs.

Wybierz kartę, wybierz region, kliknij. CUDA jest już zainstalowana.

Bez karty kredytowej · Zwrot pieniędzy w ciągu 14 dni · Anuluj w dowolnej chwili