50% de desconto todos os planos, por tempo limitado. A partir de $2.48/mo

Hospedagem GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Dedicado, sem compartilhamento.

Passthrough completo de GPU. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN e PyTorch pré-instalados.
NVMe + rede 40 Gbps. Nuvem independente desde 2008.

4.6 · 728 reviews on Trustpilot

A partir de $506.35/mo · 35% de desconto no plano anual · Sem cartão de crédito

~ ssh root@gpu-train-001 conectado
root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS em resumo

Cloudzy vende planos GPU VPS com RTX 6000 Pro, Nvidia A100, RTX 5090, e RTX 4090 cartões em de 1× a 4× configurações, a partir de $506.35 per month. Cada plano vem com a versão mais recente de CUDA, cuDNN, e drivers Nvidia pré-instalados, roda em AMD EPYC + DDR5 com Apenas NVMe armazenamento e 40 Gbps uplinks, e é provisionado em 60 segundos. As GPUs são passthrough dedicado — não vGPU, não MIG, não compartilhadas. A Cloudzy opera de forma independente desde 2008 e tem classificação 4.6 / 5 by 728+ reviewers no Trustpilot.

Preço inicial
$506.35 / mo
Tipos de GPU
6000 Pro · A100 · 5090 · 4090
Configurações
de 1× a 4×
CUDA
Pré-instalado
Desconto anual
35% de desconto
Reembolso de dinheiro
14 dias

Por que equipes de ML escolhem a Cloudzy

Computação GPU do jeito de forma interessante.

Os quatro motivos pelos quais equipes migram para a Cloudzy saindo de AWS / GCP / GPUs de hyperscalers.

Passthrough dedicado de GPU

A placa física completa é sua, sem divisão em vGPU, sem partições MIG, sem concorrência com outros clientes. Cores CUDA, VRAM, lanes PCIe — tudo dedicado.

Imagens prontas para CUDA

Drivers Nvidia mais recentes, CUDA toolkit e cuDNN já incluídos na imagem Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, um pip install e você já está treinando.

NVMe + 40 Gbps

Armazenamento NVMe puro para que o carregamento de datasets não seja o gargalo. Com 40 Gbps de rede, baixar um modelo Hugging Face de 100 GB leva segundos, não minutos.

suporte humano 24/7

Engenheiros de verdade no chat. Já ajudamos equipes suficientes a configurar treinamento multi-GPU, depurar CUDA OOMs e ajustar inferência com Llama para que as respostas cheguem rápido.

linha de GPU

Quatro famílias.
Nove formas de escalar.

RTX 6000 Pro para inferência e renderização profissional com 48 GB de VRAM ECC. A100 para treinamento e cargas de trabalho com grande VRAM. RTX 5090 para as inferências mais recentes. RTX 4090 para inferência com boa relação custo-benefício até 70B (4-bit). Planos multi-GPU disponíveis — escolha o que seu orçamento de VRAM precisa.

Passthrough completo de GPU, sem divisão, sem compartilhamento
RTX 6000 Pro
48 GB GDDR6 ECC · Pro-grade
Nvidia A100
80 GB HBM2e · ML training
RTX 5090
32 GB GDDR7 · Blackwell
RTX 4090
24 GB GDDR6X · cost-effective
1× a 4× GPU
Planos multi-GPU disponíveis
CUDA pré-instalado
PyTorch · TF · JAX prontos para uso
NVMe Puro
Conjunto de dados rápido I/O
40 Gbps uplink
Baixar modelos de 100 GB em 30s

Casos de uso

As cargas de trabalho que nossas
clientes realmente treinam.

Inferência LLM

Sirva Llama 3, Mistral, DeepSeek ou Qwen com vLLM ou Text Generation Inference. RTX 4090 suporta 70B em 4-bit, RTX 5090 suporta 70B em 8-bit, A100 suporta sem quantização.

Stable Diffusion · geração de imagens

Execute SDXL, Flux ou checkpoints Stable Diffusion com fine-tuning usando ComfyUI ou Automatic1111. RTX 4090 atinge 30+ imagens/min em SDXL padrão 1024×1024.

Treinamento ML + fine-tuning

LoRA, QLoRA, fine-tuning completo. A100 é a escolha ideal para fine-tuning sem quantização de 7B a 13B; 4× A100 suporta até 70B com sharding adequado (FSDP / DeepSpeed).

Renderização 3D · Blender

Cycles + OptiX em placas RTX é o caminho mais rápido para estúdios de animação. Os 24 GB VRAM no RTX 4090 cobrem a grande maioria das cenas de produção em frame único.

Pipelines de fala + visão

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Até o plano RTX 4090 executa inferência em tempo real nesses modelos com folga confortável.

Jobs em lote de longa duração

Geração de embeddings, pipelines de recuperação, pré-processamento de datasets. Pague por hora, execute o job, tire um snapshot da saída, destrua a instância. Mais barato do que alugar em AWS/GCP para a mesma carga de trabalho.

80 GB
A100 VRAM
40 Gbps
Ligação ascendente
Pronto para CUDA
Imagem
4 ×
GPUs Máximas
35%
Desconto anual
14 dias
Reembolso de dinheiro

Preços

Planos GPU em destaque. Por hora ou anualmente.

A cobrança anual está atualmente com 35% de desconto em todo plano GPU.

Perguntas Frequentes. GPU VPS

Perguntas frequentes respostas diretas.

Quais GPUs a Cloudzy oferece?

Quatro famílias: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, nível profissional para inferência e renderização), Nvidia A100 (1× / 2× / 4×, para treinamento ML, cargas fp16/bf16 e 80 GB HBM2e por placa), RTX 5090 (1× / 2×, arquitetura Blackwell mais recente, ideal para inferência e renderização), e RTX 4090 (1× / 2× / 4×, custo-benefício para Stable Diffusion, inferência LLM e renderização 3D).

As GPUs são dedicadas ou compartilhadas?

Dedicadas. Cada plano é um passthrough da GPU física completa, não uma fatia, não vGPU, não MIG. Os núcleos CUDA, a VRAM, a largura de banda PCIe, tudo é seu. Planos com múltiplas GPU usam NVLink quando o hardware físico suporta (planos multi-GPU com A100).

O CUDA já vem instalado?

Sim. Todo VPS GPU já inclui o CUDA toolkit estável mais recente, cuDNN e drivers Nvidia na imagem Ubuntu. PyTorch, TensorFlow, JAX e o stack Hugging Face funcionam prontos para uso. Você pode reinstalar para uma imagem Ubuntu limpa, sem CUDA, caso queira instalar uma versão específica.

Quanta VRAM eu recebo?

Por GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Planos com múltiplas GPU somam esses valores. Um plano 4× A100 tem 320 GB de VRAM no total. A lista de planos acima exibe a RAM do sistema separadamente.

Posso executar Stable Diffusion / Llama / Whisper em um VPS GPU?

Sim. O plano 1× RTX 4090 é um bom ponto de partida: VRAM suficiente para inferência com SDXL, Llama 3 70B (quantização 4-bit) ou Whisper Large. Suba para RTX 5090 ou A100 se precisar rodar modelos 70B sem quantização ou treinar LoRAs.

Como os preços se comparam aos da AWS / Google Cloud / Lambda Labs?

Em geral, mais barato para cargas de trabalho contínuas. Não diferenciamos preço por 'on-demand' vs 'spot' e não cobramos taxas de egress. Não vamos citar números de concorrentes (eles mudam todo mês). A garantia de reembolso de 14 dias permite que você compare com seu provedor atual usando seus próprios benchmarks.

Há desconto no plano anual?

Sim, 35% de desconto na cobrança anual em todos os planos GPU (menos do que os 50% nos CPU convencionais, porque o hardware GPU tem um custo de amortização maior). Sem renovação automática: você recebe uma fatura antes de cada ciclo anual para fazer downgrade, upgrade ou cancelar sem surpresas.

E a rede? São realmente 40 Gbps?

Sim. Os mesmos uplinks de 40 Gbps do nosso Cloud VPS principal, sem taxas de egress para transferências mensais dentro do limite do plano. Útil para mover grandes volumes de dados de e para o nó GPU. Baixar um modelo Hugging Face de 100 GB leva cerca de 30 segundos na velocidade máxima da linha.

Posso fazer treinamento multi-nó (vários GPU VPS juntos)?

Sim, dentro de uma mesma região. VPS no mesmo datacenter compartilham a rede local com latência abaixo de um milissegundo. No momento não oferecemos interconexão InfiniBand. Treinamento multi-nó via Ethernet padrão funciona bem para fine-tuning e jobs distribuídos de menor escala, mas não compete com HPC bare-metal para pré-treinamento em larga escala.

Há garantia de reembolso nos planos GPU?

14 dias, sem perguntas. Reembolso dentro de um ciclo de cobrança. Tempo de sobra para medir o throughput CUDA, rodar um passo de treinamento real e decidir se Cloudzy é a escolha certa para sua carga de trabalho.

Pare de pagar preços de hyperscaler.
Treine em GPUs dedicadas.

Escolha a placa, escolha a região, clique. CUDA já vem instalado.

Sem necessidade de cartão de crédito · Garantia de reembolso de 14 dias · Cancele quando quiser