50% off 全プラン、期間限定。料金は $2.48/mo

GPU VPS ホスティング

RTX 6000 Pro。A100。RTX 5090。
専有リソース、共有なし。

完全なGPUパススルー。RTX 6000 Pro、A100、RTX 5090、RTX 4090。CUDA、cuDNN、PyTorchはあらかじめインストール済み。
NVMe + 40 Gbps ネットワーク。2008年から続く独立系クラウド。

4.6 · 737

から始まる $506.35/mo · 年間契約で 35% 割引 · クレジットカード不要

GPU VPS の概要

Cloudzy GPU VPS プランを専用で提供 RTX 6000 Pro、Nvidia A100、RTX 5090、RTX 4090 カードイン 1×から4× 構成、開始価格 $506.35 per month。 各プランには最新の CUDA、cuDNN、 および Nvidia ドライバーがプリインストールされており、AMD EPYC + DDR5 上で動作し、 NVMeのみ ストレージおよび 40 Gbps アップリンクを備え、 60秒で起動できます。GPU は専用パススルーです。vGPU でも MIG でも共有でもありません。Cloudzy は 2008 そして評価されています 4.6 / 5 by 736+ reviewers Trustpilot上で。

開始価格
$506.35 / mo
GPUの種類
6000 Pro · A100 · 5090 · 4090
設定
1×から4×
CUDA
プリインストール済み
年間割引
35%オフ
返金保証
14日間

ML チームが Cloudzy を選ぶ理由

GPU コンピューティングの つまらなくない方法で

チームが AWS / GCP / ハイパースケーラーの GPU から Cloudzy に移行する 4 つの理由。

専用 GPU パススルー

物理カード全体が専有利用できます。vGPU のスライスも MIG パーティションも他テナントとの競合もありません。CUDA コア、VRAM、PCIe レーン、すべて専用です。

CUDA 対応イメージ

最新の Nvidia ドライバー、CUDA ツールキット、cuDNN をあらかじめ組み込んだ Ubuntu イメージを提供。PyTorch、TensorFlow、JAX、Hugging Face、pip install すればすぐにトレーニングを開始できます。

NVMe + 40 Gbps

純粋な NVMe ストレージでデータセットの読み込みがボトルネックになりません。40 Gbps のネットワークにより、100 GB の Hugging Face モデルの取得も数分ではなく数秒で完了します。

24時間体制の人的サポート

チャットで対応するのは実務エンジニアです。マルチ GPU トレーニングの構成、CUDA OOM のデバッグ、Llama 推論のチューニングまで、多くのチームをサポートしてきた経験があるため、迅速に回答できます。

ユースケース

対応ワークロード
実際にトレーニングを行っているユーザー向け。

LLM推論

vLLM または Text Generation Inference を使って Llama 3、Mistral、DeepSeek、Qwen を提供できます。RTX 4090 は 70B モデルの 4-bit 量子化、RTX 5090 は 70B の 8-bit 量子化、A100 は非量子化に対応します。

Stable Diffusion · 画像生成

ComfyUI または Automatic1111 を使って SDXL、Flux、またはファインチューニング済み Stable Diffusion チェックポイントを実行できます。RTX 4090 は標準的な 1024×1024 の SDXL で 30 枚/分以上を達成します。

ML トレーニング・ファインチューニング

LoRA、QLoRA、フルファインチューニングに対応。7B〜13B の非量子化ファインチューニングには A100 が最適です。4× A100 は適切なシャーディング(FSDP / DeepSpeed)により 70B まで対応できます。

3Dレンダリング · Blender

RTX カードでの Cycles + OptiX は、アニメーションスタジオにとって最速の選択肢です。RTX 4090 に搭載された 24 GB の VRAM は、シングルフレームのプロダクションシーンの大部分をカバーします。

音声・ビジョンパイプライン

Whisper Large、Faster-Whisper、YOLO、Segment Anything に対応。RTX 4090 プランでも、これらのモデルをリアルタイム推論で十分な余裕を持って実行できます。

長時間バッチ処理

埋め込み生成、検索パイプライン、データセット前処理などに最適です。時間課金で実行し、出力をスナップショットして削除すれば、同じワークロードを AWS/GCP で借り続けるより安く済みます。

価格設定

注目の GPU プラン。 時間単位または年間単位。

年払いは現在 35%オフ すべての GPU プランが対象です。

512 MB DDR5

$2.48 /mo
$4.95/mo −50%
今すぐデプロイ
1 GB DDR5

$3.48 /mo
$6.95/mo −50%
今すぐデプロイ
2 GB DDR5

$7.475 /mo
$14.95/mo −50%
今すぐデプロイ

よくある質問。GPU VPS

よくある質問 ストレートな回答。

Cloudzy が提供する GPU の種類は?

4 種類あります。RTX 6000 Pro(1 枚構成、48 GB GDDR6 ECC VRAM、推論とレンダリング向けプログレードカード)、Nvidia A100(1 枚 / 2 枚 / 4 枚構成、ML トレーニング・fp16/bf16 ワークロード対応、カードあたり 80 GB HBM2e)、RTX 5090(1 枚 / 2 枚構成、新世代の Blackwell アーキテクチャ、推論とレンダリングに最適)、RTX 4090(1 枚 / 2 枚 / 4 枚構成、Stable Diffusion・LLM 推論・3D レンダリングにコストパフォーマンスの高い選択肢)。

GPU は専有ですか?

専有です。各プランは物理 GPU をそのままパススルーで割り当てます。スライス分割でも vGPU でも MIG でもありません。CUDA コア、VRAM、PCIe 帯域幅のすべてが占有使用できます。マルチ GPU プランは、物理ハードウェアが対応している場合に NVLink を使用します(A100 のマルチ GPU プランが該当)。

CUDA はプリインストールされていますか?

はい。すべての GPU VPS には、最新の安定版 CUDA ツールキット、cuDNN、および Nvidia ドライバーが Ubuntu イメージに事前組み込みされています。PyTorch、TensorFlow、JAX、および Hugging Face スタックはすぐに使用できます。特定のバージョンをインストールしたい場合は、CUDA なしのクリーンな Ubuntu イメージに再イメージ化することも可能です。

VRAM の容量は?

GPU 1 枚あたり:RTX 6000 Pro = 48 GB GDDR6 ECC、A100 = 80 GB HBM2e、RTX 5090 = 32 GB GDDR7、RTX 4090 = 24 GB GDDR6X。マルチ GPU プランではこれが合算されます。たとえば 4× A100 プランの合計 VRAM は 320 GB です。システム RAM はプラン一覧に別途記載されています。

GPU VPS で Stable Diffusion / Llama / Whisper を実行できますか?

はい。1× RTX 4090 プランは良い出発点です。SDXL 推論、Llama 3 70B(4ビット量子化)、または Whisper Large を実行するのに十分な VRAM があります。非量子化の 70B モデルを実行したり、LoRA をトレーニングしたりする場合は、RTX 5090 または A100 にアップグレードしてください。

Cloudzy の料金は Google Cloud や Lambda Labs と比べてどうですか?

定常ワークロードでは一般的にコスト効率が高く、「オンデマンド」と「スポット」で料金を変えることもなく、転送量課金もありません。競合他社の料金は月ごとに変わるため、ここでは比較しません。14日間の返金保証があるので、実際のベンチマークで現在のプロバイダーと比べてみてください。

年間割引はありますか?

はい、GPU の全プランで年間請求を選ぶと35%割引になります(通常の CPU の50%割引より低い理由は、GPU のハードウェア償却コストが高いためです)。自動更新はなく、各年次サイクルの前に請求書をお送りするので、予期しない請求を気にせずダウングレード・アップグレード・キャンセルを選べます。

ネットワークについては?本当に40 Gbpsですか?

はい。フラッグシップの Cloud VPS と同じ 40 Gbps アップリンクを提供しており、月次転送量がプランの上限内であれば送信料はかかりません。大規模なデータセットの転送に最適で、GPU ノードへの出し入れもスムーズです。100 GB の Hugging Face モデルのダウンロードは、回線速度で約 30 秒で完了します。

マルチノードトレーニング(複数の GPU VPS を組み合わせた構成)は可能ですか?

はい、同一リージョン内では可能です。同じデータセンター内の VPS は、サブミリ秒のレイテンシでローカルネットワークを共有しています。現時点では InfiniBand 接続は提供していません。標準 Ethernet 上でのマルチノードトレーニングは、ファインチューニングや小規模な分散ジョブには十分対応できますが、大規模な事前学習においてはベアメタル HPC には及びません。

GPU プランの返金保証について

14日間、理由は不要です。返金は1請求サイクル以内に処理されます。CUDA スループットのベンチマーク、実際のトレーニングステップの実行、そして Cloudzy がワークロードに適しているかどうかの判断に十分な時間です。

ハイパースケーラーの料金を払い続けるのをやめよう。
専用の GPU でトレーニングを実行。

カードを選び、リージョンを選び、クリックするだけ。CUDAはすでにインストール済みです。