Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

GPU VPS 托管

RTX 6000 Pro。A100。RTX 5090。
独占直通，不共享切分。

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (735 reviews)

完整 GPU 直通。RTX 6000 Pro、A100、RTX 5090、RTX 4090。预装 CUDA、cuDNN，支持 PyTorch。
NVMe + 40 Gbps 网络。自 2008 年起独立运营的云服务商。

4.6 · 735 reviews on Trustpilot

部署 GPU VPS 比较 GPU 方案

从...开始 $506.35/mo · 年付享7折优惠 · 无需绑定信用卡

~ ssh root@gpu-train-001 已连接

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS 概览

Cloudzy 销售附带专属 GPU VPS 方案 RTX 6000 Pro、Nvidia A100、RTX 5090, 以及 RTX 4090 卡片中的 1× 到 4× 配置，起价 $506.35 per month。每个套餐均预装最新版 CUDA, cuDNN, 以及 Nvidia 驱动，运行于 AMD EPYC + DDR5，配有 NVMe专用 存储和 40 Gbps 上行链路，并在 60秒。GPU 均为专用直通模式，非 vGPU，非 MIG，非共享资源。Cloudzy 自 2008 并被评为 4.6 / 5 by 735+ reviewers 在 Trustpilot 上。

起始价格: $506.35 / mo
GPU 类型: 6000 Pro · A100 · 5090 · 4090
配置: 1× 到 4×
CUDA: 预先安装
年折扣: 打五折
退款: 14天

为什么 ML 团队选择 Cloudzy

GPU 计算能力有趣的方式。

团队从 AWS / GCP / 超大规模云服务商迁移到 Cloudzy 的四个原因。

专用 GPU 直通

整张物理显卡完全归你所有，无虚拟切片，无 MIG 分区，无需与其他租户竞争资源。CUDA 核心、VRAM、PCIe 通道，全部独享。

CUDA 就绪镜像

最新驱动、CUDA toolkit 和 cuDNN 已预装到镜像中。PyTorch、TensorFlow、JAX、Hugging Face，pip install 即可开始训练。

NVMe + 40 Gbps

纯 NVMe 存储，数据集加载不再是瓶颈。40 Gbps 网络带宽让你在几秒内完成 100 GB Hugging Face 模型的下载，而不是等上几分钟。

24/7人工支持

真正的工程师在线支持。我们帮助过大量团队搭建多GPU训练环境、排查CUDA内存溢出问题、调优Llama推理性能，所以遇到这些问题，我们能给你快速的答案。

GPU 产品线

四个家族。
九种扩展方式。

RTX 6000 Pro用于专业级推理和渲染，配备48 GB ECC VRAM。 A100用于训练和大VRAM工作负载。RTX 5090用于最新推理。 RTX 4090用于经济高效的推理，支持高达70B（4比特）。提供多GPU方案，选择符合您的VRAM预算的方案。

完整 GPU 直通，不切片，不共享

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

1× 至 4× GPU

多节点方案可选

CUDA 预装

PyTorch · TF · JAX 就绪

纯净 NVMe

快速数据集 I/O

40 Gbps uplink

在30秒内拉取100 GB模型

使用场景

我们的工作负载
客户实际训练所用的配置。

LLM 推理

使用 vLLM 或 Text Generation Inference 部署 Llama 3、Mistral、DeepSeek 或 Qwen。RTX 4090 支持 4-bit 量化下的 70B 模型，RTX 5090 支持 8-bit 量化下的 70B 模型，A100 支持未量化模型。

Stable Diffusion · 图像生成

使用 ComfyUI 或 Automatic1111 运行 SDXL、Flux 或微调后的 Stable Diffusion 检查点。RTX 4090 在标准 1024×1024 SDXL 任务上可达 30+ 张/分钟。

ML 训练与微调

支持 LoRA、QLoRA 及全量微调。A100 是 7B-13B 未量化微调的最佳选择；4× A100 配合分片策略（FSDP / DeepSpeed）可处理最高 70B 的模型。

3D渲染 · Blender

在 RTX 显卡上使用 Cycles + OptiX 是动画工作室最快的渲染方案。RTX 4090 上配备的 24 GB VRAM 能覆盖绝大多数单帧生产场景。

语音与视觉推理管道

支持 Whisper Large、Faster-Whisper、YOLO 和 Segment Anything。即便是 RTX 4090 方案，也能在这些模型上跑实时推理，并留有充裕余量。

长时批处理任务

向量生成、检索管道、数据集预处理。按小时计费，跑完任务，快照输出，销毁实例——同等负载下比在 AWS/GCP 上租用更划算。

80 GB

A100 VRAM

40 Gbps

上行链路

CUDA就绪

图像

4 ×

最大 GPU 数量

35%

年度折扣

14天

退款

定价

精选 GPU 方案。按小时或按年。

年付当前优惠打五折适用于所有 GPU 方案。

最受欢迎

1× RTX 6000 Pro

48 GB GDDR6 ECC VRAM

$845 /月

$1300/mo -35%

立即部署

14 天退款保障

200 GB DDR5
24 vCPU
1.3 TB NVMe NVMe
20 TB · 40 Gbps
CUDA 预装

查看全部 9 个 GPU 方案（1× 至 4× 显卡）

常见问题。GPU VPS

常见问题直接答案。

Cloudzy 提供哪些 GPU？

共四个系列：RTX 6000 Pro（1×，48 GB GDDR6 ECC VRAM，专业级推理与渲染）；Nvidia A100（1× / 2× / 4×，适用于 ML 训练、fp16/bf16 工作负载，每卡 80 GB HBM2e）；RTX 5090（1× / 2×，采用更新的 Blackwell 架构，适合推理与渲染）；以及 RTX 4090（1× / 2× / 4×，性价比高，适用于 Stable Diffusion、LLM 推理及 3D 渲染）。

GPU 是独享还是共享的？

独享。每个方案直通完整的物理 GPU，不分片、不虚拟化（vGPU）、不使用 MIG。CUDA 核心、VRAM、PCIe 带宽，全部归你。多卡方案在物理硬件支持的情况下启用 NVLink（适用于 A100 多卡方案）。

CUDA 是否已预装？

是的。所有 GPU VPS 的 Ubuntu 镜像均预置了最新稳定版 CUDA toolkit、cuDNN 及 Nvidia 驱动。PyTorch、TensorFlow、JAX 以及 Hugging Face 全栈开箱即用。如需安装特定版本，也可重装为不含 CUDA 的干净 Ubuntu 镜像。

每张 GPU 有多少 VRAM？

单卡显存：RTX 6000 Pro 为 48 GB GDDR6 ECC，A100 为 80 GB HBM2e，RTX 5090 为 32 GB GDDR7，RTX 4090 为 24 GB GDDR6X。多卡方案累加计算，例如 4× A100 方案共有 320 GB VRAM。上方方案列表中单独列出了系统 RAM 容量。

能在 GPU VPS 上运行 Stable Diffusion / Llama / Whisper 吗？

是的。1× RTX 4090 方案是个不错的起点：VRAM 足够运行 SDXL 推理、Llama 3 70B（4-bit 量化）或 Whisper Large。如果需要运行未量化的 70B 模型或训练 LoRA，可以升级到 RTX 5090 或 A100。

Cloudzy 的价格与 AWS / Google Cloud / Lambda Labs 相比如何？

对于稳定状态的工作负载，价格通常更便宜，我们不会在"按需"与"竞价"之间进行价格歧视，也不收取出站费用。我们不会引用竞争对手的数字（这些数字每月都在变化）。14天退款保证让您可以使用自己的基准与现有供应商进行A/B测试。

有年付优惠吗？

是的，所有 GPU 套餐均可享受年付八五折优惠（低于普通 CPU 的五折，原因是 GPU 的硬件摊销成本更高）。不会自动续费，每个年度周期开始前我们会发送账单，你可以根据需要降配、升配或取消，不会产生任何意外费用。

网络这块怎么样？真的有 40 Gbps 吗？

是的。与我们旗舰版 Cloud VPS 相同的 40 Gbps 上行带宽，月度流量在套餐额度内不收取出站费用。对于大量数据的传输场景非常实用——以线速拉取一个 100 GB 的 Hugging Face 模型大约只需 30 秒。

我能进行多节点训练（多块 GPU VPS 协同运行）吗？

是的，同一区域内可以互通。同一数据中心的 VPS 共享本地网络，延迟低于毫秒级。目前我们不提供 InfiniBand 互连，通过标准以太网进行多节点训练足以应对微调和小规模分布式任务，但在大规模预训练方面无法与裸金属 HPC 相比。

GPU 方案提供退款保证吗？

14 天无条件退款，在一个账单周期内处理完毕。时间完全够用——跑 CUDA 吞吐量测试、执行一次完整的训练步骤，再判断 Cloudzy 是否适合你的工作负载。

别再为超大云厂商的价格买单了。
在专用 GPU 上进行训练。

选好配置，选好地区，点击部署。CUDA 已预装就绪。