Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

GPU VPS 호스팅

RTX 6000 Pro. A100. RTX 5090.
전용 자원, 분할 없음.

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

완전한 GPU 패스스루. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN, PyTorch 사전 설치.
NVMe + 40 Gbps 네트워킹. 2008년부터 독립 클라우드.

4.6 · 728 reviews on Trustpilot

GPU VPS 배포하기 GPU 플랜 비교

시작 가격 $506.35/mo · 연간 결제 35% 할인 · 신용카드 불필요

~ ssh root@gpu-train-001 연결됨

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS 한눈에 보기

Cloudzy 전용 GPU VPS 플랜 제공 RTX 6000 Pro, Nvidia A100, RTX 5090, 및 RTX 4090 카드 안의 1×에서 4×까지 구성, 시작 가격 $506.35 per month. 각 플랜에는 최신 CUDA, cuDNN, 및 Nvidia 드라이버가 사전 설치되어 있으며, AMD EPYC + DDR5 기반으로 동작하고 NVMe 전용 스토리지와 40 Gbps 업링크를 제공하며, 프로비저닝은 60초. GPU는 전용 패스스루 방식으로, vGPU도 MIG도 공유도 없습니다. Cloudzy는 2008 부터 독립적으로 운영되어 왔으며, 평점은 4.6 / 5 by 728+ reviewers Trustpilot에서.

시작 가격: $506.35 / mo
GPU 유형: 6000 Pro · A100 · 5090 · 4090
설정: 1×에서 4×까지
CUDA: 사전 설치됨
연간 할인: 35% 할인
환불 보장: 14일

ML 팀이 Cloudzy를 선택하는 이유

GPU 컴퓨팅, 지루하지 않은 방식으로.

팀들이 AWS / GCP / 하이퍼스케일러 GPU에서 Cloudzy로 이전하는 네 가지 이유.

전용 GPU 패스스루

물리 카드 전체를 단독으로 사용합니다. vGPU 슬라이싱도, MIG 파티션도, 다른 테넌트와의 자원 경합도 없습니다. CUDA 코어, VRAM, PCIe 레인 모두 전용입니다.

CUDA 즉시 사용 가능한 이미지

최신 Nvidia 드라이버, CUDA 툴킷, cuDNN이 Ubuntu 이미지에 사전 포함되어 있습니다. PyTorch, TensorFlow, JAX, Hugging Face, pip install 하면 바로 학습을 시작할 수 있습니다.

NVMe + 40 Gbps

순수 NVMe 스토리지로 데이터셋 로딩이 병목이 되지 않습니다. 40 Gbps 네트워킹 덕분에 100 GB Hugging Face 모델도 수분이 아닌 수초 만에 다운로드됩니다.

24/7 실제 전문가 지원

채팅 상담은 실제 엔지니어가 담당합니다. 멀티-GPU 학습 환경 구성, CUDA OOM 디버깅, Llama 추론 튜닝을 충분히 경험한 만큼, 답변도 빠릅니다.

GPU 라인업

4개 가족
9가지 확장 옵션.

RTX 6000 Pro: 48 GB ECC VRAM로 전문가급 추론 및 렌더링에 적합합니다. A100: 학습 및 대용량 VRAM 워크로드용입니다. RTX 5090: 최신 추론 작업에 적합합니다. RTX 4090: 70B(4-bit)까지 비용 효율적인 추론이 가능합니다. 멀티-GPU 플랜도 제공되니, VRAM 예산에 맞게 선택하세요.

GPU 전체 패스스루 - 분할 없음, 공유 없음

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

1× ~ 4× GPU

멀티-GPU 플랜 제공

CUDA 사전 설치됨

PyTorch · TF · JAX 지원

순수 NVMe

빠른 데이터세트 I/O

40 Gbps uplink

100GB 모델을 30초 안에 가져오기

활용 사례

고객이 실제로 학습시키는
워크로드.

LLM 추론

vLLM 또는 Text Generation Inference로 Llama 3, Mistral, DeepSeek, Qwen을 서빙하세요. RTX 4090는 4-bit 기준 70B를, RTX 5090는 8-bit 기준 70B를, A100는 양자화 없이 처리합니다.

Stable Diffusion · 이미지 생성

ComfyUI 또는 Automatic1111로 SDXL, Flux, 파인튜닝된 Stable Diffusion 체크포인트를 실행하세요. RTX 4090는 표준 1024×1024 SDXL 기준 분당 30장 이상을 생성합니다.

ML 학습 + 파인튜닝

LoRA, QLoRA, 풀 파인튜닝을 모두 지원합니다. 7B-13B 비양자화 파인튜닝에는 A100가 최적이며, 4× A100는 적절한 샤딩(FSDP / DeepSpeed)으로 70B까지 처리할 수 있습니다.

3D 렌더링 · Blender

RTX 카드의 Cycles + OptiX는 애니메이션 스튜디오에 가장 빠른 선택입니다. RTX 4090의 24 GB VRAM는 대부분의 단일 프레임 프로덕션 씬을 문제없이 처리합니다.

음성 + 비전 파이프라인

Whisper Large, Faster-Whisper, YOLO, Segment Anything - RTX 4090 플랜으로도 이 모델들을 여유 있게 실시간 추론할 수 있습니다.

장시간 배치 작업

임베딩 생성, 검색 파이프라인, 데이터셋 전처리. 시간당 요금으로 작업을 실행하고, 결과를 스냅샷으로 저장한 뒤 서버를 삭제하세요. 동일한 워크로드를 AWS/GCP에서 빌리는 것보다 저렴합니다.

80 GB

A100 VRAM

40 Gbps

업링크

CUDA 준비 완료

이미지

4 ×

최대 GPU

35%

연간 할인

14일

환불 보장

요금제

주요 GPU 플랜. 시간당 또는 연간.

연간 결제 시 현재 35% 할인 모든 GPU 플랜에 적용됩니다.

가장 인기 있는

1× RTX 6000 Pro

48 GB GDDR6 ECC VRAM

$845 /월

$1300/mo -35%

지금 배포하기

14일 환불 보장

200 GB DDR5
24 vCPU
1.3 TB NVMe NVMe
20 TB · 40 Gbps
CUDA 사전 설치됨

GPU 플랜 9가지 모두 보기 (카드 1개 ~ 4개)

자주 묻는 질문. GPU VPS

자주 묻는 질문, 명확한 답변.

Cloudzy는 어떤 GPU를 제공하나요?

4가지 제품군이 있습니다: RTX 6000 Pro(1×, 48 GB GDDR6 ECC VRAM, 추론 및 렌더링용 전문가급), Nvidia A100(1× / 2× / 4×, ML 학습, fp16/bf16 워크로드, 카드당 80 GB HBM2e), RTX 5090(1× / 2×, 최신 Blackwell 아키텍처, 추론 및 렌더링에 최적), RTX 4090(1× / 2× / 4×, Stable Diffusion, LLM 추론, 3D 렌더링에 비용 효율적).

GPU는 전용인가요, 공유인가요?

전용입니다. 각 플랜은 물리적 GPU를 그대로 단독 제공합니다. 슬라이스 방식도, vGPU도, MIG도 아닙니다. CUDA 코어, VRAM, PCIe 대역폭 모두 온전히 사용자 것입니다. 멀티 GPU 플랜은 물리 하드웨어가 지원하는 경우 NVLink를 사용합니다(A100 멀티 GPU 플랜).

CUDA가 미리 설치되어 있나요?

네. 모든 GPU VPS에는 최신 안정 버전의 CUDA 툴킷, cuDNN, Nvidia 드라이버가 Ubuntu 이미지에 사전 탑재되어 있습니다. PyTorch, TensorFlow, JAX, Hugging Face 스택 모두 별도 설정 없이 바로 사용할 수 있습니다. 특정 버전을 직접 설치하려면 CUDA가 없는 순수 Ubuntu 이미지로 재설치할 수도 있습니다.

VRAM는 얼마나 제공되나요?

GPU당 용량: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. 멀티 GPU 플랜은 이를 합산합니다. 예를 들어 4× A100 플랜의 총 VRAM는 320 GB입니다. 시스템 RAM는 위 플랜 목록에 별도로 표시됩니다.

GPU VPS에서 Stable Diffusion / Llama / Whisper를 실행할 수 있나요?

네. 1× RTX 4090 플랜이 좋은 시작점입니다. SDXL 추론, Llama 3 70B(4비트 양자화), Whisper Large를 실행하기에 충분한 VRAM를 제공합니다. 비양자화 70B 모델 실행이나 LoRA 학습이 필요하다면 RTX 5090 또는 A100로 업그레이드하세요.

AWS / Google Cloud / Lambda Labs와 가격을 비교하면 어떤가요?

지속적인 워크로드 기준으로 대체로 더 저렴합니다. 온디맨드와 스팟 간 가격 차별도 없고, 이그레스 요금도 없습니다. 경쟁사 수치는 매달 바뀌기 때문에 직접 인용하지 않습니다. 14일 환불 보장 기간 동안 현재 사용 중인 공급사와 직접 벤치마크를 비교해 보세요.

연간 할인이 있나요?

네. 모든 GPU 플랜에 연간 결제 시 35% 할인이 적용됩니다(일반 CPU의 50% 할인보다 낮은 이유는 GPU 하드웨어 상각 비용이 더 높기 때문입니다). 자동 갱신은 없으며, 매년 청구 주기 전에 인보이스를 발송하므로 다운그레이드, 업그레이드, 또는 취소 시 예상치 못한 요금이 발생하지 않습니다.

네트워크는 어떤가요? 정말 40 Gbps인가요?

네. 당사의 플래그십 Cloud VPS와 동일한 40 Gbps 업링크를 제공하며, 월간 전송량이 플랜 허용치 이내라면 이그레스 요금이 없습니다. 대용량 데이터셋을 GPU 노드로 전송하거나 가져올 때 유용하며, 100 GB Hugging Face 모델은 최대 속도 기준 약 30초 만에 다운로드됩니다.

멀티 노드 학습(여러 GPU VPS를 함께 사용)이 가능한가요?

같은 리전 내에서는 가능합니다. 동일 데이터센터의 VPS는 서브 밀리초 지연의 로컬 네트워크를 공유합니다. 현재 InfiniBand 인터커넥트는 제공하지 않습니다. 표준 이더넷 기반 멀티 노드 학습은 파인 튜닝이나 소규모 분산 작업에는 충분하지만, 대규모 사전 학습에서는 베어메탈 HPC와 경쟁하기 어렵습니다.

GPU 플랜에도 환불 보장이 있나요?

14일 이내 묻지도 따지지도 않고 환불해 드립니다. 한 청구 주기 내에 처리됩니다. CUDA 처리량 벤치마크, 실제 학습 단계 실행, 그리고 Cloudzy가 해당 워크로드에 적합한지 판단하기에 충분한 시간입니다.

하이퍼스케일러 가격은 이제 그만.
전용 GPU에서 학습하세요.

카드를 선택하고, 리전을 선택하고, 클릭하세요. CUDA는 이미 설치되어 있습니다.