50% 折扣 所有计划,时间有限。开始于 $2.48/mo

深度学习GPU服务器

训练模型
专用 GPU。

NVIDIA A100、RTX 5090 和 RTX 4090 — 完整 PCI 直通,不共享。
NVMe 存储可实现快速数据加载。自 2008 年起独立云。
超过 122,000 名用户信任 Cloudzy。 14 天退款,无条件退款。

4.6 · Trustpilot 上有 684 条评论

开始于 $14.47/mo · 50% 折扣 · 无需信用卡

~ ssh root@vps-001 已连接
$ ssh root@gpu-srv-001
欢迎使用 Ubuntu 24.04 LTS (CUDA 12.4)
root@gpu-srv-001:~$ nvidia-smi --query-gpu=名称,内存.total --format=csv
名称、内存.总计 [MiB]
NVIDIA A100-SXM4-80GB,81920 MiB
root@gpu-srv-001:~$ python3 -c "导入火炬; print(torch.cuda.is_available())"
真的
root@gpu-srv-001:~$ torchrun --nproc_per_node=1 train.py --epochs 50
纪元 1/50 |损失:0.4821 | LR:1e-4

深度学习 GPU 服务器概览

Cloudzy 深度学习 GPU 服务器 使用具有完整 PCI 直通功能的 NVIDIA A100、RTX 5090 和 RTX 4090 GPU。 AMD 霄龙 中央处理器, NVMe 贮存, DDR5 记忆,以及 40 Gbps 上行链路跨越 12个地区。 CPU 计划开始于 $2.48/mo;定价页面上提供 GPU 计划。 Cloudzy 已服役 122,000+ 用户自 2008,额定 4.6/5 在 Trustpilot 上。 14天 所有计划均可退款。

起始价
$2.48 / month
配置
60秒
地区
全球12个
正常运行时间服务等级协议
99.95%
退款
14天
成立
2008

为什么建筑商选择 Cloudzy

一个精通技术的人 最喜欢的。

买家实际比较我们的四件事——做得正确。

高规格基础设施

最新一代 AMD EPYC(霄龙)、纯 NVMe 存储、DDR5 内存、40 Gbps 上行链路。每个计划层的单线程领导。

无风险试用

每个计划均提供 14 天退款保证。没有提出任何问题。没有安装费。随时从仪表板取消。

99.95% 正常运行时间 SLA

跨 12 个区域的自动监控。我们的最后 30 天 SLA 在 status.cloudzy.com 上公开跟踪 — 没有隐藏。

24/7 人工支持

实时聊天和票证回复通常不到 5 分钟。工程师,而不是剧本读者。中值分辨率低于 1 小时。

使用案例

建设者为何选择
Cloudzy 的深度学习 GPU 服务器。

模型训练

在专用 NVIDIA GPU 上训练 CNN、变压器和扩散模型。完整的 CUDA 访问、用于快速数据加载的 NVMe、用于多 GPU 训练的 NCCL。

微调法学硕士

在 A100 或 RTX 5090 上微调 Llama、Mistral 或 Gemma。在 24 GB VRAM 上进行 QLoRA,在 80 GB 上进行完全微调。 NVMe 处理检查点写入,而不会停止训练。

推理服务

通过 vLLM、TGI 或 Triton 在专用 GPU 上提供模型服务。 PCI 直通意味着完整的 VRAM 和完整的时钟速度 — 与裸机具有相同的性能。

计算机视觉

对象检测、分割、图像生成。 GPU 加速的 OpenCV、YOLO、稳定扩散。 NVMe 使训练数据管道保持无瓶颈。

研究与原型设计

Jupyter 笔记本、实验跟踪、超参数扫描。启动 GPU 服务器、运行实验、拆卸。 14 天退款意味着新项目的风险较低。

数据预处理

RAPIDS、cuDF、cuML — 针对大型数据集的 GPU 加速数据处理。在训练之前清理、转换和表征数据。 NVMe 读取使 GPU 利用率保持较高水平。

60s
配置
40 Gbps
上行链路
仅 NVMe
贮存
12
地区
99.95%
正常运行时间服务等级协议
14天
退款

全球网络

12个地区。四大洲。
一键点击即可。

在物理允许的情况下,将深度学习 GPU 服务器放置在离用户尽可能近的位置。北美和欧洲的 P50 延迟中位数低于 10 毫秒。

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

定价

按使用量付费。 就是这样。

每小时、每月或每年。无出口费。没有承诺。现在 50% 折扣 所有计划。

8 GB DDR5

训练数据管道·预处理

$26.475 /月
$52.95/mo −50%
立即部署
14 天退款
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • 专用 IPv4 + IPv6
  • 根SSH·KVM
16 GB DDR5

多GPU协调·模型服务

$49.98 /月
$99.95/mo −50%
立即部署
14 天退款
  • 8 vCPU @ EPYC
  • 350 GB NVMe
  • 10 TB · 40 Gbps
  • 专用 IPv4 + IPv6
  • 根SSH·KVM
32 GB DDR5

大规模训练·分布式计算

$109.975 /月
$219.95/mo −50%
立即部署
14 天退款
  • 12 vCPU @ EPYC
  • 750 GB NVMe
  • 12 TB · 40 Gbps
  • 专用 IPv4 + IPv6
  • 根SSH·KVM

常见问题解答 — 深度学习 GPU 服务器

常见问题, 直接的答案。

哪些 GPU 可用?

NVIDIA A100(1x、2x、4x)、RTX 5090(1x、2x)和 RTX 4090(1x、2x、4x)。全部都使用 PCI 直通 — GPU 专用于您的虚拟机,而不是共享的。完整的 VRAM、完整的时钟速度、完整的 CUDA 访问。有关当前 GPU 计划的详细信息和可用性,请参阅定价页面。

GPU 是共享的还是专用的?

投入的。 PCI 直通使您的虚拟机能够独占访问物理 GPU。 CUDA、NVENC、NCCL 的行为都与裸机完全相同。没有分时、没有 MIG 分区、GPU 本身没有虚拟化开销。

有哪些 CUDA 版本可用?

GPU 计划附带预配置的 CUDA 映像——目前 Ubuntu LTS 上的 CUDA 12.x。由于您拥有完全 root 访问权限,因此您可以安装所需的任何 CUDA 版本。 PyTorch、TensorFlow、JAX 和其他框架照常通过 pip 或 conda 安装。

深度学习需要多少 VRAM?

取决于您的型号。使用 QLoRA 微调 7B LLM 可容纳 24 GB。 7B 模型的完全微调需要 40+ GB。在大型模型上从头开始训练或运行 fp16 70B 推理需要 80 GB (A100)。将 GPU 计划与模型的内存占用相匹配。

我可以进行多 GPU 训练吗?

是的。具有 2x 或 4x GPU 的计划支持 NCCL 进行分布式训练。 PyTorch DDP、DeepSpeed、FSDP — 全部按预期工作。 NVMe 存储处理检查点保存,而不会停止训练循环。

GPU 计划有退款保证吗?

是的 — 14 天,全额退款,不问任何问题。运行您的实际训练工作,对您的推理管道进行基准测试。如果 GPU 服务器不能满足您的需求,您将获得退款。

配置速度有多快?

付款确认后 60 秒。 GPU 计划使用预配置的 CUDA 映像启动 — nvidia-smi 立即返回。安装框架并在几分钟内开始培训,而不是几个小时。

我可以在生产中使用它们进行推理吗?

是的。专用 GPU、99.95% 正常运行时间 SLA、专用 IPv4。在负载均衡器后面运行 vLLM、Triton 或您自己的推理服务器。 40 Gbps 网络可处理高吞吐量推理流量。

我还可以获得 CPU 和存储吗?

是的。 GPU 计划包括 AMD EPYC CPU(12-64 个 vCPU,具体取决于计划)、DDR5 RAM(48-768 GB)和 NVMe 存储(500 GB 至 6 TB)。 CPU 负责数据预处理,GPU 则进行训练。 NVMe 保持数据加载速度快。

与云 GPU 提供商相比定价如何?

Cloudzy GPU 计划使用专用硬件,没有分时开销。定价列在定价页面上 — 透明的月费和年费,没有隐藏的计算时间费用。 14 天退款让您可以在承诺之前进行测试。

专用 GPU 现已准备就绪。
60 秒内部署。

无需信用卡 · 14 天退款保证 · 随时取消