您的应用程序的私有 API
在您的专用 IP 上插入 OpenAI 兼容端点。构建聊天功能、摘要器或代理,而无需将用户提示发送给第三方提供商。
奥拉马 VPS 托管
基于最新 AMD EPYC 和纯 NVMe 的 Ollama 就绪 VPS。
自2008年独立。 骆驼、米斯特拉尔、Qwen、DeepSeek、Gemma — 全部在您的 IP 下。
开始于 $2.48/mo · 50% 折扣 · 无需信用卡
奥拉玛 VPS 一览
Cloudzy 主机 奥拉马- 准备好的 VPS 12个地区 横跨北美、欧洲、中东和亚洲,起始于 $2.48 per month。计划范围从 512 MB to 64 GB DDR5, 全部开启 NVMe存储 和 40 Gbps 上行链路。 Ollama 一键安装;拉 Llama 3、Mistral、Qwen、DeepSeek、Gemma 并在后面为他们服务 OpenAI 兼容 API。服务器供应于 60 秒。 Cloudzy 自此独立运营 2008 并被评为 4.6 / 5 by 684+ 评论者 在 Trustpilot 上。
为什么建筑商选择 Cloudzy
买家实际比较我们的四件事——做得正确。
AMD EPYC(霄龙)、纯 NVMe 存储、DDR5 内存、40 Gbps 上行链路。模型权重在几秒钟内从 NVMe 加载;慢速磁盘不会阻碍您的第一反应。
每个计划均提供 14 天退款保证。没有提出任何问题。没有安装费。随时从仪表板取消。
跨 12 个区域的自动监控。最近 30 天的 SLA 在 status.cloudzy.com 上公开跟踪 — 没有隐藏在 PR 后面。
实时聊天和票证回复通常不到 5 分钟。工程师,而不是剧本读者。中值分辨率低于 1 小时。
选择您的型号
Llama 3 用于安全选择,Mistral 用于一般聊天,Qwen 用于多语言,DeepSeek 用于代码,Gemma 用于小型 CPU 工作。混合搭配 — 全部都在同一个 NVMe 上。
使用案例
在您的专用 IP 上插入 OpenAI 兼容端点。构建聊天功能、摘要器或代理,而无需将用户提示发送给第三方提供商。
批量处理电子邮件、抓取网站或自动标记票证的长期运行代理不适合按使用情况定价的 API。固定费用的 VPS 可以。 Cron 工作,打 Ollama,睡觉,重复。
在编辑器的 Continue / Tabby 插件后面运行 DeepSeek-Coder 或 Qwen-Coder。快速自动完成,无每次建议成本,无需将代码发送给供应商。
拉取模型、连接 Open WebUI 或 LibreChat、与朋友分享链接。整个堆栈在一个 VPS 上,每月只需几杯咖啡的价格。
敏感数据(法律、医疗保健、内部文档)保留在您的 VPS 上。使用 iptables 和 Journald 审核访问 - 您的模型,您的边界。
拉动基本权重,在 GPU 盒上进行微调,将 GGUF 运回 CPU Ollama VPS 进行推理。平日服务便宜,仅在训练时挥霍。
全球网络
将推理主机放在用户附近。北美和欧洲的 P50 延迟中位数低于 10 毫秒。
定价
每小时、每月或每年。无出口费。没有承诺。现在 50% 折扣 所有计划。
微型 CPU 型号 · 1B–3B
CPU 上的 7B / 8B
中型CPU推理
更大的上下文 · API 主机
常见问题解答 — 奥拉马 VPS