Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

Hospedagem GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Dedicado, sem compartilhamento.

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

Passthrough completo de GPU. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN e PyTorch pré-instalados.
NVMe + rede 40 Gbps. Nuvem independente desde 2008.

4.6 · 728 reviews on Trustpilot

Implantar GPU VPS Comparar planos GPU

A partir de $506.35/mo · 35% de desconto no plano anual · Sem cartão de crédito

~ ssh root@gpu-train-001 conectado

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS em resumo

Cloudzy vende planos GPU VPS com RTX 6000 Pro, Nvidia A100, RTX 5090, e RTX 4090 cartões em de 1× a 4× configurações, a partir de $506.35 per month. Cada plano vem com a versão mais recente de CUDA, cuDNN, e drivers Nvidia pré-instalados, roda em AMD EPYC + DDR5 com Apenas NVMe armazenamento e 40 Gbps uplinks, e é provisionado em 60 segundos. As GPUs são passthrough dedicado — não vGPU, não MIG, não compartilhadas. A Cloudzy opera de forma independente desde 2008 e tem classificação 4.6 / 5 by 728+ reviewers no Trustpilot.

Preço inicial: $506.35 / mo
Tipos de GPU: 6000 Pro · A100 · 5090 · 4090
Configurações: de 1× a 4×
CUDA: Pré-instalado
Desconto anual: 35% de desconto
Reembolso de dinheiro: 14 dias

Por que equipes de ML escolhem a Cloudzy

Computação GPU do jeito de forma interessante.

Os quatro motivos pelos quais equipes migram para a Cloudzy saindo de AWS / GCP / GPUs de hyperscalers.

Passthrough dedicado de GPU

A placa física completa é sua, sem divisão em vGPU, sem partições MIG, sem concorrência com outros clientes. Cores CUDA, VRAM, lanes PCIe — tudo dedicado.

Imagens prontas para CUDA

Drivers Nvidia mais recentes, CUDA toolkit e cuDNN já incluídos na imagem Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, um pip install e você já está treinando.

NVMe + 40 Gbps

Armazenamento NVMe puro para que o carregamento de datasets não seja o gargalo. Com 40 Gbps de rede, baixar um modelo Hugging Face de 100 GB leva segundos, não minutos.

suporte humano 24/7

Engenheiros de verdade no chat. Já ajudamos equipes suficientes a configurar treinamento multi-GPU, depurar CUDA OOMs e ajustar inferência com Llama para que as respostas cheguem rápido.

linha de GPU

Quatro famílias.
Nove formas de escalar.

RTX 6000 Pro para inferência e renderização profissional com 48 GB de VRAM ECC. A100 para treinamento e cargas de trabalho com grande VRAM. RTX 5090 para as inferências mais recentes. RTX 4090 para inferência com boa relação custo-benefício até 70B (4-bit). Planos multi-GPU disponíveis — escolha o que seu orçamento de VRAM precisa.

Passthrough completo de GPU, sem divisão, sem compartilhamento

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

1× a 4× GPU

Planos multi-GPU disponíveis

CUDA pré-instalado

PyTorch · TF · JAX prontos para uso

NVMe Puro

Conjunto de dados rápido I/O

40 Gbps uplink

Baixar modelos de 100 GB em 30s

Casos de uso

As cargas de trabalho que nossas
clientes realmente treinam.

Inferência LLM

Sirva Llama 3, Mistral, DeepSeek ou Qwen com vLLM ou Text Generation Inference. RTX 4090 suporta 70B em 4-bit, RTX 5090 suporta 70B em 8-bit, A100 suporta sem quantização.

Stable Diffusion · geração de imagens

Execute SDXL, Flux ou checkpoints Stable Diffusion com fine-tuning usando ComfyUI ou Automatic1111. RTX 4090 atinge 30+ imagens/min em SDXL padrão 1024×1024.

Treinamento ML + fine-tuning

LoRA, QLoRA, fine-tuning completo. A100 é a escolha ideal para fine-tuning sem quantização de 7B a 13B; 4× A100 suporta até 70B com sharding adequado (FSDP / DeepSpeed).

Renderização 3D · Blender

Cycles + OptiX em placas RTX é o caminho mais rápido para estúdios de animação. Os 24 GB VRAM no RTX 4090 cobrem a grande maioria das cenas de produção em frame único.

Pipelines de fala + visão

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Até o plano RTX 4090 executa inferência em tempo real nesses modelos com folga confortável.

Jobs em lote de longa duração

Geração de embeddings, pipelines de recuperação, pré-processamento de datasets. Pague por hora, execute o job, tire um snapshot da saída, destrua a instância. Mais barato do que alugar em AWS/GCP para a mesma carga de trabalho.

80 GB

A100 VRAM

40 Gbps

Ligação ascendente

Pronto para CUDA

Imagem

4 ×

GPUs Máximas

35%

Desconto anual

14 dias

Reembolso de dinheiro

Preços

Planos GPU em destaque. Por hora ou anualmente.

A cobrança anual está atualmente com 35% de desconto em todo plano GPU.

Mais popular

1× RTX 6000 Pro

48 GB GDDR6 ECC VRAM

$845 /mês

$1300/mo -35%

Implementar agora

14 dias de garantia

200 GB DDR5
24 vCPU
1.3 TB NVMe NVMe
20 TB · 40 Gbps
CUDA pré-instalado

Ver todos os 9 planos GPU (1× a 4× placas)

Perguntas Frequentes. GPU VPS

Perguntas frequentes respostas diretas.

Quais GPUs a Cloudzy oferece?

Quatro famílias: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, nível profissional para inferência e renderização), Nvidia A100 (1× / 2× / 4×, para treinamento ML, cargas fp16/bf16 e 80 GB HBM2e por placa), RTX 5090 (1× / 2×, arquitetura Blackwell mais recente, ideal para inferência e renderização), e RTX 4090 (1× / 2× / 4×, custo-benefício para Stable Diffusion, inferência LLM e renderização 3D).

As GPUs são dedicadas ou compartilhadas?

Dedicadas. Cada plano é um passthrough da GPU física completa, não uma fatia, não vGPU, não MIG. Os núcleos CUDA, a VRAM, a largura de banda PCIe, tudo é seu. Planos com múltiplas GPU usam NVLink quando o hardware físico suporta (planos multi-GPU com A100).

O CUDA já vem instalado?

Sim. Todo VPS GPU já inclui o CUDA toolkit estável mais recente, cuDNN e drivers Nvidia na imagem Ubuntu. PyTorch, TensorFlow, JAX e o stack Hugging Face funcionam prontos para uso. Você pode reinstalar para uma imagem Ubuntu limpa, sem CUDA, caso queira instalar uma versão específica.

Quanta VRAM eu recebo?

Por GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Planos com múltiplas GPU somam esses valores. Um plano 4× A100 tem 320 GB de VRAM no total. A lista de planos acima exibe a RAM do sistema separadamente.

Posso executar Stable Diffusion / Llama / Whisper em um VPS GPU?

Sim. O plano 1× RTX 4090 é um bom ponto de partida: VRAM suficiente para inferência com SDXL, Llama 3 70B (quantização 4-bit) ou Whisper Large. Suba para RTX 5090 ou A100 se precisar rodar modelos 70B sem quantização ou treinar LoRAs.

Como os preços se comparam aos da AWS / Google Cloud / Lambda Labs?

Em geral, mais barato para cargas de trabalho contínuas. Não diferenciamos preço por 'on-demand' vs 'spot' e não cobramos taxas de egress. Não vamos citar números de concorrentes (eles mudam todo mês). A garantia de reembolso de 14 dias permite que você compare com seu provedor atual usando seus próprios benchmarks.

Há desconto no plano anual?

Sim, 35% de desconto na cobrança anual em todos os planos GPU (menos do que os 50% nos CPU convencionais, porque o hardware GPU tem um custo de amortização maior). Sem renovação automática: você recebe uma fatura antes de cada ciclo anual para fazer downgrade, upgrade ou cancelar sem surpresas.

E a rede? São realmente 40 Gbps?

Sim. Os mesmos uplinks de 40 Gbps do nosso Cloud VPS principal, sem taxas de egress para transferências mensais dentro do limite do plano. Útil para mover grandes volumes de dados de e para o nó GPU. Baixar um modelo Hugging Face de 100 GB leva cerca de 30 segundos na velocidade máxima da linha.

Posso fazer treinamento multi-nó (vários GPU VPS juntos)?

Sim, dentro de uma mesma região. VPS no mesmo datacenter compartilham a rede local com latência abaixo de um milissegundo. No momento não oferecemos interconexão InfiniBand. Treinamento multi-nó via Ethernet padrão funciona bem para fine-tuning e jobs distribuídos de menor escala, mas não compete com HPC bare-metal para pré-treinamento em larga escala.

Há garantia de reembolso nos planos GPU?

14 dias, sem perguntas. Reembolso dentro de um ciclo de cobrança. Tempo de sobra para medir o throughput CUDA, rodar um passo de treinamento real e decidir se Cloudzy é a escolha certa para sua carga de trabalho.

Pare de pagar preços de hyperscaler.
Treine em GPUs dedicadas.

Escolha a placa, escolha a região, clique. CUDA já vem instalado.