What is an Ollama VPS?

An Ollama VPS is a Cloudzy cloud server set up to run Ollama, the local LLM runtime. Pull open-source models like Llama 3, Mistral, Qwen, DeepSeek, or Gemma; serve them behind your own OpenAI-compatible API; build chat apps, agents, and tools without sending traffic to a third-party model provider.

Is Ollama pre-installed?

Ollama is available as a one-click install from the panel. Pick a Linux template, the binary lands on your PATH, and `ollama pull llama3` works within a minute. The HTTP API listens on port 11434 by default; bind it to your dedicated IP behind a reverse proxy.

Can I run LLMs on a CPU-only VPS?

Yes, for smaller models. Llama 3 8B and Mistral 7B run on a 16 GB CPU box, Qwen 0.5B–3B and Gemma 2B run comfortably on 4 GB. Throughput depends on the size of the model and the prompt; CPU is slower than GPU but fine for low-volume APIs, side projects, and dev work.

Do you offer GPU plans for larger models?

Yes. For 70B-class models or high-throughput inference, see our GPU plans (RTX 4090, RTX 5090, A100). The 4090 handles Llama 3 70B with quantization; A100 80GB runs full-precision big models. Linked from the pricing page.

Is the OpenAI-compatible API supported?

Yes. Ollama exposes a `/v1/chat/completions` endpoint that's drop-in compatible with the OpenAI client. Point your existing app at `http://your-vps:11434/v1` and switch the model name. Same SDK, no rewrite.

How much disk does a model take?

It depends. A 4-bit quantized 7B model is around 4 GB. An 8B is around 5 GB. A 70B at 4-bit is ~40 GB. Pull as many as you have room for. Plans start at 60 GB NVMe and go to 1.5 TB; mix and match models on one box.

How fast is provisioning?

Once payment is confirmed, your VPS is live in 60 seconds. With Ollama's one-click installed, the runtime is up in another minute. The first model pull takes longer (network-bound) but subsequent ones are warm-cached on NVMe.

Do I get a dedicated IP?

Yes, every VPS comes with a dedicated static IPv4 plus IPv6. Reach the Ollama API over the dedicated IP, slap a Caddy reverse proxy in front for HTTPS on a real hostname, and you're done. Floating IPs are available.

Are there hidden fees?

No. Egress is included in your monthly transfer allotment. Snapshots are free. IPv4 + IPv6 are included. Root access is included. The only paid extras are Floating IPs ($2.50/month) and additional snapshots beyond the free quota.

Is there a money-back guarantee?

Yes, 14 days from purchase, no questions asked, full refund. Apply from the panel or email support@cloudzy.com.

Ollama VPS ホスティング

オープンソースを動かす
お使いの VPS で LLMs を使用する。

Name: Cloudzy Ollama VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (735 reviews)

最新の AMD EPYC と純粋な NVMe で動作する、Ollama 対応の VPS。
2008年以来独立しています。 Llama、Mistral、Qwen、DeepSeek、Gemma、すべて自分のIPで管理。

4.6· 735 reviews on Trustpilot

Ollama VPS をデプロイするプランを比較する

から始まる $2.48/mo · 50%オフ · クレジットカード不要

~ ssh root@ollama-lon-001接続

root@ollama-lon-001:~# ollama pull llama3
マニフェストを取得中... モデルをダウンロード中 5.0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "VPSとは何ですか？"
A VPS（バーチャルプライベートサーバー）は、仮想化された
独自のOSと専用リソースを持つコンピューティング環境
クラウド上でホストされるリソース...
root@ollama-lon-001:~# _

Cloudzy の概要

Cloudzy ホスト Ollama-対応のVPSから 12地域 北米、ヨーロッパ、中東、アジア全域で利用可能。料金は $2.48 per month。プランの料金は 512 MB to 64 GB DDR5、すべてを NVMe ストレージ と共に 40 Gbps アップリンク。 Ollama はワンクリックでインストール完了。あとは pull するだけ。 Llama 3、Mistral、Qwen、DeepSeek、Gemma そしてそれらを背後に配置して OpenAI互換 APIサーバープロビジョニング開始 60秒. Cloudzy は、以下の年より独立して運営されています： 2008 そして評価されています 4.6 / 5 by 735+ reviewers Trustpilot上で。

開始価格: $2.48 / month
プロビジョニング: 60秒
地域: 12 ワールドワイド
稼働時間 SLA: 99.95%
返金保証: 14日間
創立: 2008

開発者がCloudzyを選ぶ理由

LLMホストお気に入り

ユーザーが実際に比較する4つのポイント、すべてに応えています。

推論向けに最適化

AMD EPYC、NVMeのみのストレージ、DDR5メモリ、40 Gbpsアップリンク。モデルの重みはNVMeから数秒で読み込まれます。ディスクの遅さが最初の応答を妨げることはありません。

リスクなしの無料トライアル

全プランに14日間の返金保証付き。理由は問いません。初期費用なし。ダッシュボードからいつでも解約できます。

99.95% アップタイム SLA

12リージョンにまたがる自動モニタリング。直近30日間のSLAはstatus.cloudzy.comで公開追跡中。PRの陰に隠れません。

24時間体制の人的サポート

ライブチャットとチケットの返答は通常5分以内。対応するのはエンジニアであり、スクリプト読み上げ担当者ではありません。解決までの中央値は1時間以内。

モデルを選ぶ

オープンウェイトモデル。
あと一歩。

安全性を重視するならLlama 3、汎用チャットにはMistral、多言語対応はQwen、コード生成はDeepSeek、軽量 CPU 作業にはGemma。自由に組み合わせて、すべて同じ NVMe 上で動かせます。

すべてのプランでカスタムGGUFのアップロードに対応

Llama 3

8B / 70B / 405B

Mistral

7B / Mixtral 8x7B

Qwen

0.5B – 72B Alibaba

DeepSeek

Coder / Chat / R1

Gemma

2B / 7B Google

Phi

Microsoftの小規模モデル

ユースケース

開発者がCloudzyを選ぶ理由
Cloudzy の Ollama VPS。

アプリ専用のプライベート API

専用IPに直接つながる、OpenAI互換のエンドポイント。チャット機能、要約、エージェントを、ユーザーのプロンプトを外部プロバイダーに送ることなく構築できます。

バックグラウンドエージェント

長時間稼働するエージェントで、メールの一括処理・サイトのスクレイピング・チケットの自動タグ付けなどを行う場合、従量課金制のAPIには向きません。定額制のVPSなら問題なく動きます。cronジョブを設定して、Ollamaを叩いて、あとは待つだけ。それを繰り返す。

コード補助

エディタのContinue / Tabbyプラグインで DeepSeek-Coder や Qwen-Coder を動かす。補完はキビキビ速く、提案ごとの課金なし、コードは外部に送らない。

ホビー向けチャット・RAGデモ

モデルをダウンロードして、Open WebUI か LibreChat を接続し、リンクを友人と共有するだけ。月数杯のコーヒー代で、すべてのスタックを1台の VPS 上に構築できる。

コンプライアンス対応のLLM

機密データ（法務・医療・社内文書）は、お使いのVPSの中に留まります。iptablesとjournaldでアクセスを監査できます。モデルもセキュリティ境界も、すべて自分で管理。

独自のファインチューニングモデルを構築する

ベースウェイトを取得し、GPU マシンでファインチューニングを行い、完成した GGUF を CPU Ollama VPS に戻して推論に使う。平日の推論は低コストに抑え、費用をかけるのはトレーニング時だけ。

60s

プロビジョニング

40 Gbps

アップリンク

NVMeのみ

ストレージ

地域

99.95%

稼働時間 SLA

14日間

返金保証

グローバルネットワーク

12リージョン、4大陸。
選んで、モデルを取得する。

推論ホストをユーザーの近くに配置。北米・欧州では P50 レイテンシの中央値が 10 ms を下回ります。

12リージョンをすべて見る

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

価格設定

使った分だけ支払う。それだけです。

時間単位、月単位、年単位。転送料なし。縛りなし。現在 50% off すべてのプラン。

1 GB DDR5

Tiny CPU モデル · 1B～3B

$3.48/月

$6.95/mo−50%

今すぐデプロイ

14日間返金保証

1 vCPU @ EPYC
25 GB NVMe
1 TB · 40 Gbps
Dedicated IPv4 + IPv6専用
ワンクリックで Ollama

2 GB DDR5

7B / 8B on CPU

$7.475/月

$14.95/mo−50%

今すぐデプロイ

14日間返金保証

1 vCPU @ EPYC
60 GB NVMe
3 TB · 40 Gbps
Dedicated IPv4 + IPv6専用
ワンクリックで Ollama

最も人気

4 GB DDR5

中規模 CPU 推論

$14.47/月

$28.95/mo−50%

今すぐデプロイ

14日間返金保証

2 vCPU @ EPYC
120 GB NVMe
5 TB · 40 Gbps
Dedicated IPv4 + IPv6専用
ワンクリックで Ollama

最も人気

8 GB DDR5

より広いコンテキスト · API ホスト

$26.475/月

$52.95/mo−50%

今すぐデプロイ

14日間返金保証

4 vCPU @ EPYC
240 GB NVMe
7 TB · 40 Gbps
Dedicated IPv4 + IPv6専用
ワンクリックで Ollama

さらに必要ですか？全10プランを見る（最大 64 GB）

よくある質問。Ollama VPS

よくある質問ストレートな回答。

Ollama VPS とは何ですか？

Ollama VPS は、ローカル LLM ランタイムである Ollama を実行するために設定された Cloudzy クラウドサーバーです。Llama 3、Mistral、Qwen、DeepSeek、Gemma などのオープンソースモデルを取得し、独自の OpenAI 互換 API の背後で提供できます。サードパーティのモデルプロバイダーにトラフィックを送ることなく、チャットアプリ、エージェント、ツールを構築できます。

Ollama はプリインストールされていますか？

Ollama はパネルからワンクリックでインストールできます。Linux テンプレートを選択するだけで、バイナリが PATH に追加され、`ollama pull llama3` が1分以内に動作します。HTTP API はデフォルトでポート 11434 をリッスンします。リバースプロキシの背後で専用 IP にバインドしてください。

CPU のみの VPS で LLM を実行できますか？

小さいモデルであれば可能です。Llama 3 8B と Mistral 7B は 16 GB CPU のサーバーで動作し、Qwen 0.5B〜3B と Gemma 2B は 4 GB でも快適に動作します。スループットはモデルサイズとプロンプトに依存します。CPU は GPU より低速ですが、低トラフィックの API、個人プロジェクト、開発作業には十分です。

大規模モデル向けの GPU プランはありますか？

あります。70B クラスのモデルや高スループットの推論には、GPU プラン（RTX 4090、RTX 5090、A100）をご覧ください。4090 は量子化で Llama 3 70B を処理でき、A100 80GB はフル精度の大規模モデルを実行できます。料金ページからリンクしています。

OpenAI 互換 API はサポートされていますか？

はい。Ollama は `/v1/chat/completions` エンドポイントを公開しており、OpenAI クライアントとそのまま互換性があります。既存のアプリの接続先を `http://your-vps:11434/v1` に変更し、モデル名を切り替えるだけです。同じ SDK を使用でき、コードの書き直しは不要です。

モデルのディスク容量はどのくらい必要ですか？

モデルによります。4ビット量子化の 7B モデルは約 4 GB、8B は約 5 GB、70B の 4ビット量子化は約 40 GB です。空き容量の範囲で好きなだけ取得できます。プランは 60 GB NVMe から始まり、最大 1.5 TB まで対応しています。1台のサーバーで複数のモデルを組み合わせて使用できます。

プロビジョニングはどれくらい速いですか？

支払いが確認されると、VPS は 60 秒で起動します。Ollama をワンクリックでインストールすれば、ランタイムはさらに1分以内に立ち上がります。最初のモデルの取得はネットワーク速度に依存しますが、以降は NVMe にキャッシュされるため高速です。

専用IPが付きますか？

はい、すべての VPS には専用の静的 IPv4 と IPv6 が付属します。専用 IP 経由で Ollama API にアクセスし、実際のホスト名で HTTPS を使用するにはリバースプロキシとして Caddy を設置するだけです。フローティング IP も利用できます。

隠れた費用はありますか？

いいえ。アウトバウンド転送は月額プランの転送量に含まれています。スナップショットは無料です。IPv4 + IPv6も含まれています。rootアクセスも含まれています。有料オプションはFloating IP（月$2.50）と無料枠を超えた追加スナップショットのみです。

返金保証はありますか？

はい、購入から 14 日以内であれば理由を問わず全額返金します。パネルから申請するか、[email protected] までメールでご連絡ください。

準備は整っています。
ollama run、60 秒で。

リージョンを選んでクリックし、モデルを取得するだけ。プライベートな LLM と専用 IP が手に入ります。

Ollama VPS をデプロイする全プランを比較する

クレジットカード不要・14日間返金保証・いつでもキャンセル可能

オープンソースを動かすお使いの VPS で LLMs を使用する。

LLMホスト お気に入り

推論向けに最適化

リスクなしの無料トライアル

99.95% アップタイム SLA

24時間体制の人的サポート

オープンウェイトモデル。あと一歩。

開発者がCloudzyを選ぶ理由Cloudzy の Ollama VPS。

アプリ専用のプライベート API

バックグラウンドエージェント

コード補助

ホビー向けチャット・RAGデモ

コンプライアンス対応のLLM

独自のファインチューニングモデルを構築する

12リージョン、4大陸。選んで、モデルを取得する。

使った分だけ支払う。 それだけです。

よくある質問 ストレートな回答。

Ollama VPS とは何ですか？

Ollama はプリインストールされていますか？

CPU のみの VPS で LLM を実行できますか？

大規模モデル向けの GPU プランはありますか？

OpenAI 互換 API はサポートされていますか？

モデルのディスク容量はどのくらい必要ですか？

プロビジョニングはどれくらい速いですか？

専用IPが付きますか？

隠れた費用はありますか？

返金保証はありますか？

準備は整っています。ollama run、60 秒で。

オープンソースを動かす
お使いの VPS で LLMs を使用する。

LLMホストお気に入り

オープンウェイトモデル。
あと一歩。

開発者がCloudzyを選ぶ理由
Cloudzy の Ollama VPS。

12リージョン、4大陸。
選んで、モデルを取得する。

使った分だけ支払う。それだけです。

よくある質問ストレートな回答。

準備は整っています。
ollama run、60 秒で。