五折优惠 所有套餐限时优惠,起价 $2.48/mo

深度学习 GPU 服务器

在以下位置训练模型
专用GPU。

NVIDIA A100、RTX 5090 和 RTX 4090,完整 PCI 直通,非共享资源。
NVMe 存储,快速加载数据。独立云服务商,自 2008 年起。
超过 122,000 名用户信赖 Cloudzy。14 天无理由退款。

4.6 · 721 reviews on Trustpilot

从...开始 $14.47/mo · 五折优惠 · 无需信用卡

~ ssh root@vps-001 已连接
$ ssh root@gpu-srv-001
欢迎使用 Ubuntu 24.04 LTS (CUDA 12.4)
root@gpu-srv-001:~$ nvidia-smi --query-gpu=name,memory.total --format=csv
名称, 总内存 [MiB]
NVIDIA A100-SXM4-80GB, 81920 MiB
root@gpu-srv-001:~$ python3 -c "import torch; print(torch.cuda.is_available())"
正确
root@gpu-srv-001:~$ torchrun --nproc_per_node=1 train.py --epochs 50
Epoch 1/50 | Loss: 0.4821 | LR: 1e-4

深度学习 GPU 服务器概览

Cloudzy 深度学习 GPU 服务器 使用 NVIDIA A100、H100 和 H200 GPU,全程 PCI 直通。 AMD EPYC CPU, NVMe 存储, DDR5 内存,以及 40 Gbps 跨链路 12个地区。CPU 方案起价 $2.48/mo;GPU 方案详见定价页面。 Cloudzy 已服务 122,000+ 用户自 2008,评分 4.6/5 在 Trustpilot 上。 14天 所有方案均提供退款保障。

起始价格
$2.48 / month
配置
60秒
地区
12 全球
正常运行时间 SLA
99.95%
退款
14天
成立
2008

开发者为什么选择 Cloudzy

精通技术的 最喜爱的

买家真正拿来比较我们的四件事,我们都做到位了。

高规格基础设施

最新一代 AMD EPYC 专属存储、NVMe 专属存储、DDR5 内存,40 Gbps 上行带宽。每个套餐层级均具备顶级单线程性能。

无风险试用

每个方案均提供14天无理由退款保障。无需解释原因,无开户费用,随时可在控制台取消。

99.95% 正常运行时间 SLA

全球12个区域自动监控。过去30天的 SLA 数据公开记录于 status.cloudzy.com,没有任何隐瞒。

24/7人工支持

在线客服与工单回复通常在5分钟内响应。由工程师直接处理,不是照本宣科的客服脚本。问题中位解决时间不超过1小时。

使用场景

为什么开发者选择
Cloudzy 深度学习 GPU 服务器。

模型训练

在专用 NVIDIA GPU 上训练 CNN、Transformer 和扩散模型。完整 CUDA 访问权限,NVMe 高速数据加载,NCCL 支持多 GPU 训练。

微调 LLM

在 A100 或 H100 上微调 Llama、Mistral 或 Gemma。24 GB VRAM 支持 QLoRA,80 GB 支持全量微调。NVMe 高速写入检查点,不阻塞训练进程。

推理服务

通过 vLLM、TGI 或 Triton 在专用 GPU 上部署模型。PCI 直通意味着完整 VRAM 和全速时钟,性能与裸金属一致。

计算机视觉

目标检测、图像分割、图像生成。GPU 加速 OpenCV、YOLO、Stable Diffusion。NVMe 保障训练数据管道持续供给,无瓶颈。

研究与原型设计

Jupyter Notebook、实验追踪、超参数调优。按需启动 GPU 服务器,运行实验,用完即停。14 天退款保障,新项目风险极低。

数据预处理

RAPIDS、cuDF、cuML。GPU 加速大规模数据处理。在训练前完成数据清洗、转换和特征工程。NVMe 高速读取保持 GPU 利用率持续在线。

60s
配置
40 Gbps
上行链路
NVMe专用
存储
12
地区
99.95%
正常运行时间 SLA
14天
退款

全球网络

12个区域,横跨四大洲。
一键即达。

将深度学习 GPU 服务器部署到离用户尽可能近的位置。北美和欧洲 P50 中位延迟低于 10 ms。

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

定价

按实际用量付费。 就这样。

按小时、按月或按年计费。无出站流量费,无绑定承诺。当前 五折优惠 所有套餐

8 GB DDR5

训练数据管道 · 数据预处理

$26.475 /月
$52.95/mo 负50%
立即部署
14 天退款保障
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • 专用 IPv4 + IPv6
  • Root SSH · KVM
16 GB DDR5

多 GPU 协调 · 模型部署

$49.98 /月
$99.95/mo 负50%
立即部署
14 天退款保障
  • 8 vCPU @ EPYC
  • 350 GB NVMe
  • 10 TB · 40 Gbps
  • 专用 IPv4 + IPv6
  • Root SSH · KVM
32 GB DDR5

大规模训练 · 分布式计算

$109.975 /月
$219.95/mo 负50%
立即部署
14 天退款保障
  • 12 vCPU @ EPYC
  • 750 GB NVMe
  • 12 TB · 40 Gbps
  • 专用 IPv4 + IPv6
  • Root SSH · KVM

常见问题 — 深度学习 GPU 服务器

常见问题 直接答案。

提供哪些 GPU?

NVIDIA A100(1x、2x、4x)、H100(1x、2x)和 H200(1x、2x、4x)。全部采用 PCI 直通,GPU 专属分配给您的虚拟机,不共享。完整 VRAM、全速时钟、完整 CUDA 访问权限。当前 GPU 方案详情和可用情况请查看定价页面。

GPU 是共享还是独占?

独占。PCI 直通让您的虚拟机独享物理 GPU 访问权限。CUDA、NVENC、NCCL 的行为与裸金属完全一致。无时间片共享,无 MIG 分区,GPU 本身无虚拟化开销。

支持哪个 CUDA 版本?

GPU 方案预装 CUDA 镜像,当前为 Ubuntu LTS 上的 CUDA 12.x。由于您拥有完整 root 权限,可自行安装任意 CUDA 版本。PyTorch、TensorFlow、JAX 及其他框架均可通过 pip 或 conda 正常安装。

深度学习需要多少 VRAM?

取决于你的模型。用 QLoRA 微调 7B LLM,24 GB 就够了。全量微调 7B 模型需要 40 GB 以上。从头训练大模型或运行 fp16 70B 推理需要 80 GB(A100)。根据模型的显存占用选择对应的 GPU 方案。

可以做多 GPU 训练吗?

可以。配备 2x 或 4x GPU 的方案支持 NCCL 分布式训练。PyTorch DDP、DeepSpeed、FSDP 均可正常使用。NVMe 存储在保存检查点时不会阻塞训练流程。

GPU 方案有退款保障吗?

有,14 天全额退款,无需任何理由。跑完实际训练任务,测完推理流水线。如果 GPU 服务器达不到你的要求,全额退款。

配置速度有多快?

支付确认后 60 秒内即可使用。GPU 方案启动时附带预配置的 CUDA 镜像,nvidia-smi 立即响应。安装好框架,几分钟内开始训练,无需等待数小时。

可以用于生产环境的推理吗?

可以。独享 GPU、99.95% 正常运行时间 SLA、独享 IPv4。在负载均衡器后部署 vLLM、Triton 或自定义推理服务器。40 Gbps 网络带宽可承载高吞吐量的推理流量。

还包括 CPU 和存储吗?

包括。GPU 方案配备 AMD EPYC CPU(12 到 64 个 vCPU,视方案而定)、DDR5 RAM(48 到 768 GB)以及 NVMe 存储(500 GB 到 6 TB)。CPU 负责数据预处理,GPU 专注训练,NVMe 保证数据加载速度。

与云端 GPU 服务商相比,定价如何?

Cloudzy GPU 方案使用独享硬件,无时间片共享开销。定价在价格页面公开展示,按月和按年计费,不收取隐性的计算时长费用。14 天退款保障,先测试再决定。

独享 GPU,即刻可用。
在 60 秒内部署。

无需信用卡 · 14 天退款保证 · 随时取消