Which GPUs are available?

NVIDIA A100 (1x, 2x, 4x), RTX 5090 (1x, 2x), and RTX 4090 (1x, 2x, 4x). All use PCI passthrough, the GPU is dedicated to your VM, not shared. Full VRAM, full clock speeds, full CUDA access. See the pricing page for current GPU plan details and availability.

Are the GPUs shared or dedicated?

Dedicated. PCI passthrough gives your VM exclusive access to the physical GPU. CUDA, NVENC, NCCL all behave exactly like bare metal. No time-sharing, no MIG partitioning, no virtualization overhead on the GPU itself.

What CUDA version is available?

GPU plans ship with pre-configured CUDA images, currently CUDA 12.x on Ubuntu LTS. You can install any CUDA version you need since you have full root access. PyTorch, TensorFlow, JAX, and other frameworks install via pip or conda as usual.

How much VRAM do I need for deep learning?

Depends on your model. Fine-tuning a 7B LLM with QLoRA fits in 24 GB. Full fine-tune of a 7B model needs 40+ GB. Training from scratch on large models or running fp16 70B inference needs 80 GB (A100). Match GPU plan to your model's memory footprint.

Can I do multi-GPU training?

Yes. Plans with 2x or 4x GPUs support NCCL for distributed training. PyTorch DDP, DeepSpeed, FSDP, all work as expected. NVMe storage handles checkpoint saves without stalling the training loop.

Is there a money-back guarantee on GPU plans?

Yes, 14 days, full refund, no questions asked. Run your actual training job, benchmark your inference pipeline. If the GPU server doesn't meet your needs, you get your money back.

How fast is provisioning?

60 seconds from payment confirmation. GPU plans boot with a pre-configured CUDA image, nvidia-smi returns immediately. Install your framework and start training in minutes, not hours.

Can I use these for inference in production?

Yes. Dedicated GPU, 99.95% uptime SLA, dedicated IPv4. Run vLLM, Triton, or your own inference server behind a load balancer. 40 Gbps network handles high-throughput inference traffic.

Do I also get CPU and storage?

Yes. GPU plans include AMD EPYC CPUs (12-64 vCPU depending on plan), DDR5 RAM (48-768 GB), and NVMe storage (500 GB to 6 TB). The CPU handles data preprocessing while the GPU trains. NVMe keeps data loading fast.

How does pricing compare to cloud GPU providers?

Cloudzy GPU plans use dedicated hardware with no time-sharing overhead. Pricing is listed on the pricing page, transparent monthly and annual rates with no hidden compute-hour charges. 14-day money-back lets you test before committing.

深度学习 GPU 服务器

在以下位置训练模型
专用GPU。

Name: Cloudzy Deep Learning GPU Server
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

NVIDIA A100、RTX 5090 和 RTX 4090，完整 PCI 直通，非共享资源。
NVMe 存储，快速加载数据。独立云服务商，自 2008 年起。
超过 122,000 名用户信赖 Cloudzy。14 天无理由退款。

4.6 · 728 reviews on Trustpilot

部署 GPU 服务器对比套餐

从...开始 $14.47/mo · 五折优惠 · 无需信用卡

~ ssh root@vps-001 已连接

$ ssh root@gpu-srv-001
欢迎使用 Ubuntu 24.04 LTS (CUDA 12.4)
root@gpu-srv-001:~$ nvidia-smi --query-gpu=name,memory.total --format=csv
名称, 总内存 [MiB]
NVIDIA A100-SXM4-80GB, 81920 MiB
root@gpu-srv-001:~$ python3 -c "import torch; print(torch.cuda.is_available())"
正确
root@gpu-srv-001:~$ torchrun --nproc_per_node=1 train.py --epochs 50
Epoch 1/50 | Loss: 0.4821 | LR: 1e-4

深度学习 GPU 服务器概览

Cloudzy 深度学习 GPU 服务器 使用 NVIDIA A100、H100 和 H200 GPU，全程 PCI 直通。 AMD EPYC CPU， NVMe 存储， DDR5 内存，以及 40 Gbps 跨链路 12个地区。CPU 方案起价 $2.48/mo；GPU 方案详见定价页面。 Cloudzy 已服务 122,000+ 用户自 2008，评分 4.6/5 在 Trustpilot 上。 14天 所有方案均提供退款保障。

起始价格: $2.48 / month
配置: 60秒
地区: 12 全球
正常运行时间 SLA: 99.95%
退款: 14天
成立: 2008

开发者为什么选择 Cloudzy

精通技术的最喜爱的

买家真正拿来比较我们的四件事，我们都做到位了。

高规格基础设施

最新一代 AMD EPYC 专属存储、NVMe 专属存储、DDR5 内存，40 Gbps 上行带宽。每个套餐层级均具备顶级单线程性能。

无风险试用

每个方案均提供14天无理由退款保障。无需解释原因，无开户费用，随时可在控制台取消。

99.95% 正常运行时间 SLA

全球12个区域自动监控。过去30天的 SLA 数据公开记录于 status.cloudzy.com，没有任何隐瞒。

24/7人工支持

在线客服与工单回复通常在5分钟内响应。由工程师直接处理，不是照本宣科的客服脚本。问题中位解决时间不超过1小时。

使用场景

为什么开发者选择
Cloudzy 深度学习 GPU 服务器。

模型训练

在专用 NVIDIA GPU 上训练 CNN、Transformer 和扩散模型。完整 CUDA 访问权限，NVMe 高速数据加载，NCCL 支持多 GPU 训练。

微调 LLM

在 A100 或 H100 上微调 Llama、Mistral 或 Gemma。24 GB VRAM 支持 QLoRA，80 GB 支持全量微调。NVMe 高速写入检查点，不阻塞训练进程。

推理服务

通过 vLLM、TGI 或 Triton 在专用 GPU 上部署模型。PCI 直通意味着完整 VRAM 和全速时钟，性能与裸金属一致。

计算机视觉

目标检测、图像分割、图像生成。GPU 加速 OpenCV、YOLO、Stable Diffusion。NVMe 保障训练数据管道持续供给，无瓶颈。

研究与原型设计

Jupyter Notebook、实验追踪、超参数调优。按需启动 GPU 服务器，运行实验，用完即停。14 天退款保障，新项目风险极低。

数据预处理

RAPIDS、cuDF、cuML。GPU 加速大规模数据处理。在训练前完成数据清洗、转换和特征工程。NVMe 高速读取保持 GPU 利用率持续在线。

60s

配置

40 Gbps

上行链路

NVMe专用

存储

地区

99.95%

正常运行时间 SLA

14天

退款

全球网络

12个区域，横跨四大洲。
一键即达。

将深度学习 GPU 服务器部署到离用户尽可能近的位置。北美和欧洲 P50 中位延迟低于 10 ms。

查看全部 12 个区域

 us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1 

定价

按实际用量付费。就这样。

按小时、按月或按年计费。无出站流量费，无绑定承诺。当前五折优惠所有套餐

最受欢迎

4 GB DDR5

入门级 GPU 工作负载 · 微调准备

$14.47 /月

$28.95/mo 负50%

立即部署

14 天退款保障

2 vCPU @ EPYC
120 GB NVMe
5 TB · 40 Gbps
专用 IPv4 + IPv6
Root SSH · KVM

8 GB DDR5

训练数据管道 · 数据预处理

$26.475 /月

$52.95/mo 负50%

立即部署

14 天退款保障

4 vCPU @ EPYC
240 GB NVMe
7 TB · 40 Gbps
专用 IPv4 + IPv6
Root SSH · KVM

16 GB DDR5

多 GPU 协调 · 模型部署

$49.98 /月

$99.95/mo 负50%

立即部署

14 天退款保障

8 vCPU @ EPYC
350 GB NVMe
10 TB · 40 Gbps
专用 IPv4 + IPv6
Root SSH · KVM

32 GB DDR5

大规模训练 · 分布式计算

$109.975 /月

$219.95/mo 负50%

立即部署

14 天退款保障

12 vCPU @ EPYC
750 GB NVMe
12 TB · 40 Gbps
专用 IPv4 + IPv6
Root SSH · KVM

需要更多？查看全部 10 个套餐（最高 64 GB）

常见问题 — 深度学习 GPU 服务器

常见问题直接答案。

提供哪些 GPU？

NVIDIA A100（1x、2x、4x）、H100（1x、2x）和 H200（1x、2x、4x）。全部采用 PCI 直通，GPU 专属分配给您的虚拟机，不共享。完整 VRAM、全速时钟、完整 CUDA 访问权限。当前 GPU 方案详情和可用情况请查看定价页面。

GPU 是共享还是独占？

独占。PCI 直通让您的虚拟机独享物理 GPU 访问权限。CUDA、NVENC、NCCL 的行为与裸金属完全一致。无时间片共享，无 MIG 分区，GPU 本身无虚拟化开销。

支持哪个 CUDA 版本？

GPU 方案预装 CUDA 镜像，当前为 Ubuntu LTS 上的 CUDA 12.x。由于您拥有完整 root 权限，可自行安装任意 CUDA 版本。PyTorch、TensorFlow、JAX 及其他框架均可通过 pip 或 conda 正常安装。

深度学习需要多少 VRAM？

取决于你的模型。用 QLoRA 微调 7B LLM，24 GB 就够了。全量微调 7B 模型需要 40 GB 以上。从头训练大模型或运行 fp16 70B 推理需要 80 GB（A100）。根据模型的显存占用选择对应的 GPU 方案。

可以做多 GPU 训练吗？

可以。配备 2x 或 4x GPU 的方案支持 NCCL 分布式训练。PyTorch DDP、DeepSpeed、FSDP 均可正常使用。NVMe 存储在保存检查点时不会阻塞训练流程。

GPU 方案有退款保障吗？

有，14 天全额退款，无需任何理由。跑完实际训练任务，测完推理流水线。如果 GPU 服务器达不到你的要求，全额退款。

配置速度有多快？

支付确认后 60 秒内即可使用。GPU 方案启动时附带预配置的 CUDA 镜像，nvidia-smi 立即响应。安装好框架，几分钟内开始训练，无需等待数小时。

可以用于生产环境的推理吗？

可以。独享 GPU、99.95% 正常运行时间 SLA、独享 IPv4。在负载均衡器后部署 vLLM、Triton 或自定义推理服务器。40 Gbps 网络带宽可承载高吞吐量的推理流量。

还包括 CPU 和存储吗？

包括。GPU 方案配备 AMD EPYC CPU（12 到 64 个 vCPU，视方案而定）、DDR5 RAM（48 到 768 GB）以及 NVMe 存储（500 GB 到 6 TB）。CPU 负责数据预处理，GPU 专注训练，NVMe 保证数据加载速度。

与云端 GPU 服务商相比，定价如何？

Cloudzy GPU 方案使用独享硬件，无时间片共享开销。定价在价格页面公开展示，按月和按年计费，不收取隐性的计算时长费用。14 天退款保障，先测试再决定。

独享 GPU，即刻可用。
在 60 秒内部署。

部署 GPU 服务器对比所有方案

无需信用卡 · 14 天退款保证 · 随时取消

在以下位置训练模型 专用GPU。

精通技术的 最喜爱的

高规格基础设施

无风险试用

99.95% 正常运行时间 SLA

24/7人工支持

为什么开发者选择 Cloudzy 深度学习 GPU 服务器。

模型训练

微调 LLM

推理服务

计算机视觉

研究与原型设计

数据预处理

12个区域，横跨四大洲。 一键即达。

按实际用量付费。 就这样。

常见问题 直接答案。

提供哪些 GPU？

GPU 是共享还是独占？

支持哪个 CUDA 版本？

深度学习需要多少 VRAM？

可以做多 GPU 训练吗？

GPU 方案有退款保障吗？

配置速度有多快？

可以用于生产环境的推理吗？

还包括 CPU 和存储吗？

与云端 GPU 服务商相比，定价如何？

独享 GPU，即刻可用。 在 60 秒内部署。

在以下位置训练模型
专用GPU。

精通技术的最喜爱的

为什么开发者选择
Cloudzy 深度学习 GPU 服务器。

12个区域，横跨四大洲。
一键即达。

按实际用量付费。就这样。

常见问题直接答案。

独享 GPU，即刻可用。
在 60 秒内部署。