メインコンテンツへスキップ
50% off 全プラン対象、期間限定。月額 $2.48/mo

ChatGPT VPS ホスティング

あなた専用のAIサーバー、
あなた自身のルールで。

Self-host open-weight LLMs and AI APIs on AMD EPYC with NVMe storage.
Independent cloud since 2008, no vendor lock-in, no usage caps.
Trusted by 122,000+ users · from $2.48/mo.

4.7 · 755 reviews on Trustpilot

開始価格 $2.48/mo · 50% off · クレジットカード不要

~ ssh root@ai-001 接続
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Installing Ollama...
Ollama installed successfully.
root@ai-001:~# ollama pull llama3
pulling model llama3... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS の概要

Cloudzy offers ChatGPT VPS hosting for self-hosting LLMs and AI inference across 13 regions, starting at $2.48/mo. Every plan runs on AMD EPYC with DDR5 memory, NVMe storage, and 40 Gbps uplinks. Install Ollama, llama.cpp, vLLM, or your own inference stack, full root access, no API rate limits. Provision in 60 seconds. Independent since 2008, rated 4.7/5 by 700+ reviewers on Trustpilot.

開始価格
月額2.48ドル
CPU
AMD EPYC · DDR5
プロビジョニング
60秒
地域
世界13カ所
返金保証
14日間
創立
2008

開発者がCloudzyを選ぶ理由

技術に精通した お気に入り

ユーザーが実際に比較する4つのポイントを、しっかり押さえました。

ハイスペックなインフラ

最新世代のAMD EPYC、NVMe専用ストレージ、DDR5メモリ、40 Gbpsアップリンク。全プラン階層でシングルスレッド性能はトップクラス。

リスクなしのトライアル

全プランで14日間の返金保証。理由を問いません。セットアップ料なし。ダッシュボードからいつでもキャンセル可。

稼働率SLA 99.95%

13リージョン全体で自動モニタリング。直近30日のSLAは status.cloudzy.com で公開しています。隠しません。

24時間365日の有人サポート

ライブチャットとチケット返信は通常5分以内。スクリプトを読むだけのスタッフではなくエンジニアが対応します。中央値で1時間以内に解決。

セルフホスト可能な AI ツール

Open-weight models, your infrastructure.

任意のオープンウェイトモデルや AI フレームワークを実行できます。完全な root アクセスにより、スタック、モデル、サービングレイヤーをすべて自分で選択可能。サードパーティの API キーは不要です。

Ollama
ワンコマンドで LLM をサービング
llama.cpp
CPU 最適化推論
vLLM
高スループットサービング
Open WebUI
LLM 向けチャットインターフェース
LangChain
オーケストレーションフレームワーク
Hugging Face
モデルハブ + Transformers

ユースケース

開発者が選ぶ理由
Cloudzy の ChatGPT VPS。

プライベートな ChatGPT 代替環境

Llama 3、Mistral、または Phi を自分のサーバー上で Open WebUI とともに実行。チャットインターフェースと会話履歴を備え、データは VPS の外に出ません。

アプリ向け API バックエンド

独自の REST API の背後で LLM をサービング。トークン単位の課金なし、レート制限なし。SaaS、ボット、または社内ツールと連携できます。

ファインチューニングと実験

データセットをアップロードし、LoRA アダプターのファインチューニングや評価を実行。永続的な NVMe ストレージにより、チェックポイントは再起動後も保持されます。

RAG パイプラインサーバー

ローカル LLM とベクター DB(Chroma、Qdrant、Weaviate)を組み合わせて、検索拡張生成を実現。すべて 1 台のサーバーで完結します。

複数モデルの比較

Llama、Mistral、Phi を並べて動かす。本番環境で採用するモデルを決める前に、出力・レイテンシ・品質を比較できる。

AI コーディングアシスタント

Code Llama や DeepSeek Coder をセルフホストし、ローカル API 経由で IDE に接続する。コードを外部に送信せずに、オートコンプリートとチャットが使える。

60s
プロビジョニング
40 Gbps
アップリンク
NVMeのみ
ストレージ
13
地域
99.95%
稼働率SLA
14 days
返金保証

グローバルネットワーク

13リージョン。4大陸。
1クリックで利用可能。

ChatGPT VPS を物理的に可能な限りユーザーの近くに配置する。北米・ヨーロッパでの P50 中央値レイテンシは 10 ms 未満。

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

価格設定

使った分だけお支払い。 それだけです。

時間単位、月単位、年単位。egress費用なし。契約縛りなし。現在 50% off 全プラン。

512 MB DDR5

小型モデル・テスト用

$2.48 /mo
$4.95/mo −50%
今すぐデプロイ
14日間返金保証
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • 専用IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

小型 LLM・7B パラメータ

$7.475 /mo
$14.95/mo −50%
今すぐデプロイ
14日間返金保証
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • 専用IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

13B 以上のモデル・RAG スタック

$26.475 /mo
$52.95/mo −50%
今すぐデプロイ
14日間返金保証
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • 専用IPv4 + IPv6
  • Root SSH · KVM

よくあるご質問 — ChatGPT VPS

よくある質問、 明快な回答。

自分の VPS で ChatGPT を動かせますか?

ChatGPT 自体は OpenAI の独自サービスですが、Llama 3、Mistral、Phi、DeepSeek などのオープンウェイトの代替モデルを自分の Cloudzy VPS 上でセルフホストできます。Ollama や Open WebUI を使えば、完全なプライバシーを保ちながら同様のチャット体験が得られます。

LLM の推論に必要な RAM はどのくらいですか?

モデルのサイズによって異なります。7B パラメータのモデル(Llama 3 8B の量子化版など)は 4〜8 GB の RAM で動作します。13B モデルには 8〜16 GB、70B の大型モデルには 32〜64 GB が必要です。小型モデルなら 4 GB プランから始めて、必要に応じてスケールアップしてください。

LLM を動かすには GPU が必要ですか?

いいえ。llama.cpp や Ollama は AMD EPYC 上での CPU 推論向けに最適化されています。GPU と比べてトークン生成速度は落ちますが、個人利用・小規模チーム・非同期バッチ処理であれば CPU 推論で十分機能し、コストも GPU ホスティングの何分の一かで済みます。

複数のモデルを同時にホストできますか?

はい。十分な RAM があれば、Ollama や vLLM を使って複数のモデルを実行し、切り替えることができます。各モデルは必要なときにメモリへ読み込まれます。16 GB プランであれば、小型モデルを 2〜3 個同時に問題なく提供できます。

データのプライバシーはどうなっていますか?

すべてのデータは自分の VPS 上に保持されます。サードパーティの API にデータが送信されることはありません。モデル・データ・ネットワークはすべて自分で管理します。これがホスト型 AI サービスに対する最大のメリットです。プロンプトも応答も、サーバーの外に出ることはありません。

Ollama はどうやってインストールしますか?

コマンド一発で完了です: curl -fsSL https://ollama.ai/install.sh | sh。その後、ollama pull llama3 でモデルを取得すればチャットを開始できます。新規 VPS でも、一連の作業は 5 分もかかりません。

LLM を API として公開できますか?

はい。Ollama はデフォルトでポート 11434 に OpenAI 互換の API を提供します。vLLM も OpenAI 互換のエンドポイントを公開します。アプリ・ボット・フロントエンドから自分の VPS の IP とポートに向けるだけです。

稼働率の保証はありますか?

Cloudzy は全プランで 99.95% の稼働率 SLA を提供しています。冗長ネットワークパスと 40 Gbps の接続により、AI サーバーは常時稼働を維持します。

このVPSでモデルのファインチューニングはできますか?

CPUでのファインチューニングは可能ですが、速度は遅めです。小規模モデル(7B)のLoRA/QLoRAファインチューニングであれば、高RAMのCPUプランで試験的に利用できます。大規模モデルの本番ファインチューニングには、GPUインスタンスの方が現実的です。

返金ポリシーはどのようになっていますか?

14日間の返金保証付き、理由不問。AIセットアップをテストし、推論速度をベンチマークして、判断してください。ダッシュボードまたはサポート経由で全額返金に対応します。

いつでも、あなた次第。
AI server in 60 seconds.

クレジットカード不要 · 14日間返金保証 · いつでもキャンセル可