50% off 所有套餐限时优惠,起价 $2.48/mo

Ollama VPS 托管服务

运行开源模型
在您的 VPS 上运行 LLMs。

在最新 AMD EPYC 和纯 NVMe 上运行,Ollama 就绪的 VPS。
Independent since 2008. Llama、Mistral、Qwen、DeepSeek、Gemma,全部使用您自己的 IP。

4.6· 713 reviews on Trustpilot

Starting at $2.48/mo · 五折优惠 · 无需信用卡

~ ssh root@ollama-lon-001connected
root@ollama-lon-001:~# ollama pull llama3
正在拉取清单… 正在拉取模型 5.0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "What's a VPS?"
A VPS,即虚拟私有服务器,是一种虚拟化的
拥有独立操作系统和专属
资源,托管于云端……
root@ollama-lon-001:~# _

Ollama VPS 概览

Cloudzy hosts Ollama-ready VPSes from 12 regions 覆盖北美、欧洲、中东及亚洲,起价 $2.48 per month. 套餐起价从 512 MB to 64 GB DDR5, all on NVMe storage with 40 Gbps 上行链路。 Ollama 一键安装;拉取 Llama 3、Mistral、Qwen、DeepSeek、Gemma 并通过 兼容 OpenAI 的 API. Servers provision in 60 seconds. Cloudzy 自以下年份起独立运营: 2008 and is rated 4.6 / 5 by 713+ reviewers on Trustpilot.

Starting price
$2.48 / month
Provisioning
60 seconds
Regions
12 worldwide
Uptime SLA
99.95%
Money-back
14 days
Founded
2008

开发者为什么选择 Cloudzy

An LLM host favorite.

买家真正拿来比较我们的四件事,我们都做到位了。

专为推理优化

AMD EPYC, NVMe-only storage, DDR5 memory, 40 Gbps uplinks. Model weights load from NVMe in seconds; no slow disk choking your first response.

无风险试用

每个套餐均提供 14 天退款保证。无需说明理由,无开户费用,随时可在控制台取消。

99.95% uptime SLA

12 个区域的全自动监控。过去 30 天的 SLA 数据公开发布在 status.cloudzy.com,没有任何粉饰。

24/7 human support

在线客服与工单回复通常在5分钟内响应。由工程师直接处理,不是照本宣科的客服脚本。问题中位解决时间不超过1小时。

选择您的机型

开源权重模型。
一键拉取,即刻就绪。

Llama 3 适合稳健场景,Mistral 适合通用对话,Qwen 适合多语言任务,DeepSeek 适合代码,Gemma 适合轻量级 CPU 任务。按需组合,全部运行在同一台 NVMe 上。

每个套餐均支持上传自定义 GGUF 文件
Llama 3
8B / 70B / 405B
Mistral
7B / Mixtral 8x7B
Qwen
0.5B – 72B Alibaba
DeepSeek
Coder / Chat / R1
Gemma
2B / 7B Google
Phi
微软小型模型

Use cases

为什么开发者选择
Cloudzy 的 Ollama VPS。

专属于您应用的私有 API

在你的专属 IP 上部署兼容 OpenAI 的接口,直接可用。构建聊天功能、摘要工具或 AI 代理,用户提示词不会流向任何第三方服务商。

Background agents

长时间运行的 agent——批量处理邮件、抓取网站或自动标记工单——并不适合按用量计费的 API。固定费率的 VPS 才是正确选择。设好定时任务,调用 Ollama,等待,循环。

Code assistants

在你的编辑器中通过 Continue / Tabby 插件运行 DeepSeek-Coder 或 Qwen-Coder。代码补全响应迅速,无按次计费,代码也不会上传给第三方。

兴趣聊天与 RAG 演示

拉取模型,接入 Open WebUI 或 LibreChat,把链接分享给朋友。整套环境跑在一台 VPS 上,每月费用不过几杯咖啡。

合规友好型 LLMs

敏感数据(法律、医疗、内部文件)始终保存在您的 VPS 上。通过 iptables 和 journald 审计访问记录,模型由您掌控,边界由您定义。

训练你自己的微调模型

拉取基础权重,在 GPU 上完成微调,再将 GGUF 文件部署回 CPU Ollama VPS 进行推理。训练时再按需升配,日常推理保持低成本即可。

60s
Provisioning
40 Gbps
Uplink
NVMe-only
Storage
12
Regions
99.95%
Uptime SLA
14 days
Money-back

Global network

12个区域,横跨四大洲。
选好配置,拉取模型。

将推理节点部署在用户附近。北美和欧洲的 P50 中位延迟低于 10 ms。

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

Pricing

按实际用量付费。 That's it.

按小时、按月或按年计费。无出站流量费,无绑定承诺。当前 50% off all plans.

1 GB DDR5

小型 CPU 模型 · 1B–3B

$3.48/mo
$6.95/mo−50%
Deploy now
14 天退款保障
  • 1 vCPU @ EPYC
  • 25 GB NVMe
  • 1 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • 一键 Ollama
2 GB DDR5

7B / 8B on CPU

$7.475/mo
$14.95/mo−50%
Deploy now
14 天退款保障
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • 一键 Ollama

常见问题

Common questions, straight answers.

Ollama VPS 是什么?

Ollama VPS 是一台专为运行 Ollama(本地 LLM 运行时)配置的 Cloudzy 云服务器。你可以拉取 Llama 3、Mistral、Qwen、DeepSeek 或 Gemma 等开源模型,通过自己的 OpenAI 兼容 API 对外提供服务,构建聊天应用、智能体和工具,无需将流量发送给第三方模型供应商。

Ollama 是否已预装?

Ollama 可在控制面板中一键安装。选择 Linux 模板后,二进制文件会自动加入 PATH,`ollama pull llama3` 一分钟内即可运行。HTTP API 默认监听 11434 端口,可通过反向代理将其绑定到你的独立 IP。

我能在纯 CPU 的 VPS 上运行 LLM 吗?

可以,适用于较小的模型。Llama 3 8B 和 Mistral 7B 可在 16 GB CPU 的机器上运行,Qwen 0.5B–3B 和 Gemma 2B 在 4 GB 下也能流畅运行。吞吐量取决于模型大小和提示长度。CPU 比 GPU 慢,但对于低并发 API、个人项目和开发测试来说完全够用。

你们是否提供适合大模型的 GPU 套餐?

有。如需运行 70B 级别模型或高吞吐量推理,请查看我们的 GPU 套餐(RTX 4090、RTX 5090、A100)。4090 可配合量化运行 Llama 3 70B,A100 80GB 可运行全精度大模型。详情见定价页面。

是否支持 OpenAI 兼容 API?

支持。Ollama 提供 `/v1/chat/completions` 接口,可直接替换 OpenAI 客户端。将现有应用指向 `http://your-vps:11434/v1`,修改模型名称即可。SDK 不变,无需重写代码。

一个模型需要多少磁盘空间?

视情况而定。4-bit 量化的 7B 模型约占 4 GB,8B 约占 5 GB,70B 的 4-bit 版本约占 40 GB。只要空间够,拉取多少模型都行。套餐磁盘从 60 GB NVMe 起,最高可达 1.5 TB,可在同一台机器上混合部署多个模型。

配置速度有多快?

付款确认后,你的 VPS 将在 60 秒内上线。Ollama 一键安装完成后,运行时再过约一分钟即可就绪。首次拉取模型耗时较长(受网络速度限制),后续模型会热缓存在 NVMe 上。

Do I get a dedicated IP?

每台 VPS 均配备专属静态 IPv4 和 IPv6。通过独立 IP 访问 Ollama API,在前面部署 Caddy 反向代理以实现真实域名的 HTTPS,即可完成配置。也支持浮动 IP。

有隐藏费用吗?

不收取额外费用。出站流量包含在每月流量配额内。快照免费。IPv4 和 IPv6 均已包含。root 访问权限已包含。唯一的付费附加项为浮动 IP(2.50 美元/月)以及超出免费配额的额外快照。

有退款保证吗?

支持。购买后 14 天内均可申请全额退款,无需说明原因。在控制面板操作或发邮件至 [email protected] 即可。

随时可以上手。
ollama run,60 秒启动。

选择地区,点击部署,拉取模型。专属 LLM,独立 IP。

无需信用卡 · 14 天退款保证 · 随时取消