50% de descuento todos los planes, tiempo limitado. Desde $2.48/mo

Hosting de GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Dedicada, no compartida.

Passthrough completo de GPU. RTX 6000 Pro, A100, RTX 5090, RTX 4090. CUDA, cuDNN y PyTorch preinstalados y listos para usar.
NVMe + redes de 40 Gbps. Nube independiente desde 2008.

4.7 · 747 reseñas en Trustpilot

Desde $506.35/mo · 35% de descuento anual · Sin tarjeta de crédito

~ ssh root@gpu-train-001 conectado
root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS de un vistazo

Cloudzy ofrece planes de GPU VPS con RTX 6000 Pro, Nvidia A100, RTX 5090 dedicadas, y RTX 4090 tarjetas en configuraciones de 1× a 4× configuraciones, desde $506.35 per month. Cada plan incluye preinstalados los últimos controladores de CUDA, cuDNN y Nvidia, se ejecuta sobre AMD EPYC + DDR5 con Solo NVMe almacenamiento y 40 Gbps enlaces de subida, y se aprovisiona en 60 segundos. Las GPU son passthrough dedicado, no vGPU, no MIG, no compartidas. Cloudzy opera de forma independiente desde 2008 y tiene una valoración de 4.7 / 5 by 747+ reseñas en Trustpilot.

Precio inicial
$506.35 / mo
tipos GPU
6000 Pro · A100 · 5090 · 4090
Configuraciones
1× a 4×
CUDA
Preinstalado
Descuento anual
35% de descuento
Reembolso
14 días

Por qué los equipos de ML eligen Cloudzy

Computa con GPU sin aburrirte.

Las cuatro razones por las que los equipos dejan AWS / GCP / los GPU de los hyperscalers y se pasan a Cloudzy.

GPU dedicada en passthrough

La tarjeta física completa es tuya: sin slicing de vGPU, sin particiones MIG, sin contención con otros inquilinos. Núcleos CUDA, VRAM, lanes PCIe, todo dedicado.

Imágenes listas para CUDA

Últimos drivers de Nvidia, CUDA toolkit y cuDNN ya incluidos en la imagen Ubuntu. PyTorch, TensorFlow, JAX, Hugging Face, pip install y ya estás entrenando.

NVMe + 40 Gbps

Almacenamiento NVMe puro para que la carga de datasets no sea el cuello de botella. Con 40 Gbps de red, descargar un modelo Hugging Face de 100 GB tarda segundos, no minutos.

Soporte humano 24/7

Ingenieros reales en el chat. Hemos ayudado a suficientes equipos a configurar entrenamiento multi-GPU, depurar CUDA OOMs y ajustar la inferencia de Llama como para que las respuestas lleguen rápido.

Catálogo de GPU

Cuatro familias.
Nueve formas de escalar.

RTX 6000 Pro para inferencia y renderizado profesional con 48 GB de VRAM ECC. A100 para entrenamiento y cargas de trabajo con alta VRAM. RTX 5090 para la inferencia más reciente. RTX 4090 para inferencia rentable hasta 70B (4-bit). Planes multi-GPU disponibles: elige según el presupuesto de VRAM que necesites.

GPU en passthrough completo, sin slicing, sin compartir
RTX 6000 Pro
48 GB GDDR6 ECC · Pro-grade
Nvidia A100
80 GB HBM2e · ML training
RTX 5090
32 GB GDDR7 · Blackwell
RTX 4090
24 GB GDDR6X · cost-effective
1× a 4× GPU
Planes multi-GPU disponibles
CUDA preinstalado
PyTorch · TF · JAX listo
NVMe Puro
Dataset rápido I/O
40 Gbps uplink
Descarga modelos de 100 GB en 30 segundos

Casos de uso

Las cargas de trabajo que nuestros
clientes entrenan de verdad.

Inferencia LLM

Sirve Llama 3, Mistral, DeepSeek o Qwen con vLLM o Text Generation Inference. RTX 4090 soporta 70B a 4 bits, RTX 5090 soporta 70B a 8 bits, A100 soporta sin cuantizar.

Stable Diffusion · generación de imágenes

Ejecuta SDXL, Flux o checkpoints Stable Diffusion ajustados con ComfyUI o Automatic1111. RTX 4090 alcanza más de 30 imágenes/min en SDXL estándar a 1024×1024.

Entrenamiento ML y fine-tuning

LoRA, QLoRA, fine-tuning completo. A100 es la opción ideal para fine-tuning sin cuantizar de modelos 7B-13B; 4× A100 gestiona hasta 70B con particionado adecuado (FSDP / DeepSpeed).

Renderizado 3D · Blender

Cycles + OptiX en tarjetas RTX es la opción más rápida para estudios de animación. Los 24 GB de VRAM en RTX 4090 cubren la gran mayoría de escenas de producción de fotograma único.

Pipelines de voz y visión

Whisper Large, Faster-Whisper, YOLO, Segment Anything. Incluso el plan RTX 4090 ejecuta inferencia en tiempo real sobre estos modelos con margen de sobra.

Trabajos batch de larga duración

Generación de embeddings, pipelines de recuperación, preprocesamiento de datasets. Paga por hora, ejecuta el trabajo, toma un snapshot de la salida, destruye la instancia: más barato que alquilar en AWS/GCP para la misma carga de trabajo.

80 GB
A100 VRAM
40 Gbps
Enlace ascendente
Listo para CUDA
Imagen
4 ×
GPUs máximos
35%
Descuento anual
14 días
Reembolso

Precios

Planes GPU destacados. Por hora o anual.

La facturación anual tiene actualmente 35% de descuento en cada plan GPU.

Preguntas frecuentes. GPU VPS

Preguntas habituales, respuestas directas.

¿Qué GPUs ofrece Cloudzy?

Cuatro familias: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, nivel profesional para inferencia y renderizado), Nvidia A100 (1× / 2× / 4×, para entrenamiento de ML, cargas de trabajo fp16/bf16 y 80 GB HBM2e por tarjeta), RTX 5090 (1× / 2×, arquitectura Blackwell de nueva generación, ideal para inferencia y renderizado) y RTX 4090 (1× / 2× / 4×, opción económica para Stable Diffusion, inferencia LLM y renderizado 3D).

¿Las GPUs son dedicadas o compartidas?

Dedicadas. Cada plan asigna la GPU física completa, sin particiones, sin vGPU, sin MIG. Los núcleos CUDA, la VRAM y el ancho de banda PCIe son exclusivamente tuyos. Los planes con varias GPU utilizan NVLink cuando el hardware físico lo permite (planes multi-GPU con A100).

¿CUDA viene preinstalado?

Sí. Todos los VPS con GPU incluyen el CUDA toolkit estable más reciente, cuDNN y los drivers de Nvidia integrados en la imagen Ubuntu. PyTorch, TensorFlow, JAX y el stack Hugging Face están listos para usar desde el primer momento. Si necesitas una versión específica, puedes reinstalar una imagen Ubuntu limpia sin CUDA.

¿Cuánta VRAM incluye cada plan?

Por GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. En los planes con varias GPU, la memoria se suma: un plan 4× A100 dispone de 320 GB de VRAM en total. La lista de planes muestra la RAM del sistema por separado.

¿Puedo ejecutar Stable Diffusion / Llama / Whisper en un VPS con GPU?

Sí. El plan 1× RTX 4090 es un buen punto de partida: tiene suficiente VRAM para inferencia con SDXL, Llama 3 70B (cuantizado a 4 bits) o Whisper Large. Sube a RTX 5090 o A100 si necesitas ejecutar modelos 70B sin cuantizar o entrenar LoRAs.

¿Cómo se comparan los precios con AWS / Google Cloud / Lambda Labs?

Por lo general, más económico para cargas de trabajo continuas: no diferenciamos precios entre instancias 'bajo demanda' y 'spot', y no cobramos tarifas de salida de datos. No citaremos cifras de la competencia (cambian cada mes). La garantía de devolución de 14 días te permite comparar con tu proveedor actual usando tus propios benchmarks.

¿Hay descuento por pago anual?

Sí, un 35% de descuento en la facturación anual para todos los planes GPU (menos que el 50% de los planes CPU estándar, porque el hardware GPU tiene un coste de amortización mayor). Sin renovación automática: recibirás una factura antes de cada ciclo anual para que puedas cambiar de plan, actualizar o cancelar sin cargos inesperados.

¿Qué hay del ancho de banda? ¿Son realmente 40 Gbps?

Sí. Los mismos uplinks de 40 Gbps que nuestro Cloud VPS principal, sin tarifas de salida para la transferencia mensual dentro del límite del plan. Útil para mover grandes conjuntos de datos hacia y desde el nodo GPU: descargar un modelo Hugging Face de 100 GB tarda unos 30 segundos a velocidad de línea.

¿Puedo hacer entrenamiento multi-nodo (varios VPS con GPU juntos)?

Sí, dentro de una misma región. Los VPS del mismo centro de datos comparten la red local con latencia inferior al milisegundo. Por ahora no ofrecemos interconexión InfiniBand. El entrenamiento multi-nodo sobre Ethernet estándar funciona bien para fine-tuning y trabajos distribuidos a pequeña escala, pero no compite con HPC en bare-metal para preentrenamiento a gran escala.

¿Hay garantía de devolución en los planes GPU?

14 días, sin preguntas. El reembolso se realiza dentro de un ciclo de facturación. Tiempo más que suficiente para medir el rendimiento de CUDA, ejecutar un paso de entrenamiento real y decidir si Cloudzy se adapta a tu carga de trabajo.

Deja de pagar precios de hyperscaler.
Entrena en GPU dedicadas.

Elige una tarjeta, elige una región, haz clic. CUDA ya está instalado.

Sin tarjeta de crédito · Garantía de reembolso en 14 días · Cancela cuando quieras