50% off 全プラン、期間限定。料金は $2.48/mo

ChatGPT VPS ホスティング

あなた専用のAIサーバー、
あなた自身のルールで。

オープンウェイトの LLM と AI API をセルフホストするなら AMD EPYC と共に NVMe ストレージ
独立系クラウドとして 2008、ベンダーロックインなし、使用量の上限なし。
信頼されている 122,000+ ユーザー · から $2.48/mo.

4.6 · 721 reviews on Trustpilot

から始まる $2.48/mo · 50%オフ · クレジットカード不要

~ ssh root@ai-001 接続
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Ollamaをインストール中...
Ollama のインストールが完了しました。
root@ai-001:~# ollama pull llama3
モデルllama3をダウンロード中... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS の概要

Cloudzy 提供します ChatGPT VPS セルフホスト型 LLM と AI 推論のためのホスティング、 12地域、から開始 $2.48/mo。全プランは AMD EPYC と共に DDR5 メモリ, NVMe ストレージ、および 40 Gbps アップリンク対応。Ollama、llama.cpp、vLLM、または独自の推論スタックをインストール可能。完全な root アクセス、API のレート制限なし。プロビジョニングは 60秒独立してから 2008、評価済み 4.6/5 by 679以上のレビュアー Trustpilot上で。

開始価格
$2.48 / month
CPU
AMD EPYC · DDR5
プロビジョニング
60秒
地域
12 ワールドワイド
返金保証
14日間
創立
2008

開発者がCloudzyを選ぶ理由

テック系の お気に入り

ユーザーが実際に比較する4つのポイント、すべてに応えています。

ハイスペックなインフラ

最新世代のAMD EPYC、NVMe専用ストレージ、DDR5メモリ、40 Gbpsアップリンク。全プランでシングルスレッド性能をリード。

リスクなしの無料トライアル

全プランに14日間の返金保証。理由不問、設定費用なし。ダッシュボードからいつでもキャンセル可能。

99.95% アップタイム SLA

12リージョンで自動監視。過去30日間のSLAはstatus.cloudzy.comで公開追跡中。情報を隠すことはありません。

24時間体制の人的サポート

ライブチャットとチケットの返答は通常5分以内。対応するのはエンジニアであり、スクリプト読み上げ担当者ではありません。解決までの中央値は1時間以内。

セルフホスト可能な AI ツール

オープンウェイトモデル、 あなたのインフラストラクチャ。

任意のオープンウェイトモデルや AI フレームワークを実行できます。完全な root アクセスにより、スタック、モデル、サービングレイヤーをすべて自分で選択可能。サードパーティの API キーは不要です。

Ollama
ワンコマンドで LLM をサービング
llama.cpp
CPU 最適化推論
vLLM
高スループットサービング
WebUIを開く
LLM 向けチャットインターフェース
LangChain
オーケストレーションフレームワーク
Hugging Face
モデルハブ + Transformers

ユースケース

開発者がCloudzyを選ぶ理由
Cloudzy の ChatGPT VPS。

プライベートな ChatGPT 代替環境

Llama 3、Mistral、または Phi を自分のサーバー上で Open WebUI とともに実行。チャットインターフェースと会話履歴を備え、データは VPS の外に出ません。

アプリ向け API バックエンド

独自の REST API の背後で LLM をサービング。トークン単位の課金なし、レート制限なし。SaaS、ボット、または社内ツールと連携できます。

ファインチューニングと実験

データセットをアップロードし、LoRA アダプターのファインチューニングや評価を実行。永続的な NVMe ストレージにより、チェックポイントは再起動後も保持されます。

RAG パイプラインサーバー

ローカル LLM とベクター DB(Chroma、Qdrant、Weaviate)を組み合わせて、検索拡張生成を実現。すべて 1 台のサーバーで完結します。

複数モデルの比較

Llama、Mistral、Phi を並べて動かす。本番環境で採用するモデルを決める前に、出力・レイテンシ・品質を比較できる。

AI コーディングアシスタント

Code Llama や DeepSeek Coder をセルフホストし、ローカル API 経由で IDE に接続する。コードを外部に送信せずに、オートコンプリートとチャットが使える。

60s
プロビジョニング
40 Gbps
アップリンク
NVMeのみ
ストレージ
12
地域
99.95%
稼働時間 SLA
14日間
返金保証

グローバルネットワーク

12リージョン、4大陸。
ワンクリックで接続。

ChatGPT VPS を物理的に可能な限りユーザーの近くに配置する。北米・ヨーロッパでの P50 中央値レイテンシは 10 ms 未満。

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

価格設定

使った分だけ支払う。 それだけです。

時間単位、月単位、年単位。転送料なし。縛りなし。現在 50% off すべてのプラン。

512 MB DDR5

小型モデル・テスト用

$2.48 /月
$4.95/mo −50%
今すぐデプロイ
14日間返金保証
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Dedicated IPv4 + IPv6専用
  • ルート SSH · KVM
2 GB DDR5

小型 LLM・7B パラメータ

$7.475 /月
$14.95/mo −50%
今すぐデプロイ
14日間返金保証
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedicated IPv4 + IPv6専用
  • ルート SSH · KVM
8 GB DDR5

13B 以上のモデル・RAG スタック

$26.475 /月
$52.95/mo −50%
今すぐデプロイ
14日間返金保証
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Dedicated IPv4 + IPv6専用
  • ルート SSH · KVM

よくある質問 — ChatGPT VPS

よくある質問 ストレートな回答。

自分の VPS で ChatGPT を動かせますか?

ChatGPT 自体は OpenAI の独自サービスですが、Llama 3、Mistral、Phi、DeepSeek などのオープンウェイトの代替モデルを自分の Cloudzy VPS 上でセルフホストできます。Ollama や Open WebUI を使えば、完全なプライバシーを保ちながら同様のチャット体験が得られます。

LLM の推論に必要な RAM はどのくらいですか?

モデルのサイズによって異なります。7B パラメータのモデル(Llama 3 8B の量子化版など)は 4〜8 GB の RAM で動作します。13B モデルには 8〜16 GB、70B の大型モデルには 32〜64 GB が必要です。小型モデルなら 4 GB プランから始めて、必要に応じてスケールアップしてください。

LLM を動かすには GPU が必要ですか?

いいえ。llama.cpp や Ollama は AMD EPYC 上での CPU 推論向けに最適化されています。GPU と比べてトークン生成速度は落ちますが、個人利用・小規模チーム・非同期バッチ処理であれば CPU 推論で十分機能し、コストも GPU ホスティングの何分の一かで済みます。

複数のモデルを同時にホストできますか?

はい。十分な RAM があれば、Ollama や vLLM を使って複数のモデルを実行し、切り替えることができます。各モデルは必要なときにメモリへ読み込まれます。16 GB プランであれば、小型モデルを 2〜3 個同時に問題なく提供できます。

データのプライバシーはどうなっていますか?

すべてのデータは自分の VPS 上に保持されます。サードパーティの API にデータが送信されることはありません。モデル・データ・ネットワークはすべて自分で管理します。これがホスト型 AI サービスに対する最大のメリットです。プロンプトも応答も、サーバーの外に出ることはありません。

Ollama はどうやってインストールしますか?

コマンド一発で完了です: curl -fsSL https://ollama.ai/install.sh | sh。その後、ollama pull llama3 でモデルを取得すればチャットを開始できます。新規 VPS でも、一連の作業は 5 分もかかりません。

LLM を API として公開できますか?

はい。Ollama はデフォルトでポート 11434 に OpenAI 互換の API を提供します。vLLM も OpenAI 互換のエンドポイントを公開します。アプリ・ボット・フロントエンドから自分の VPS の IP とポートに向けるだけです。

稼働率の保証はありますか?

Cloudzy は全プランで 99.95% の稼働率 SLA を提供しています。冗長ネットワークパスと 40 Gbps の接続により、AI サーバーは常時稼働を維持します。

このVPSでモデルのファインチューニングはできますか?

CPUでのファインチューニングは可能ですが、速度は遅めです。小規模モデル(7B)のLoRA/QLoRAファインチューニングであれば、高RAMのCPUプランで試験的に利用できます。大規模モデルの本番ファインチューニングには、GPUインスタンスの方が現実的です。

返金ポリシーはどのようになっていますか?

14日間の返金保証付き、理由不問。AIセットアップをテストし、推論速度をベンチマークして、判断してください。ダッシュボードまたはサポート経由で全額返金に対応します。

準備は整っています。
AI server in 60 seconds.

クレジットカード不要・14日間返金保証・いつでもキャンセル可能