Which GPUs does Cloudzy offer?

Four families: RTX 6000 Pro (1×, 48 GB GDDR6 ECC VRAM, pro-grade for inference and rendering), Nvidia A100 (1× / 2× / 4×, for ML training, fp16/bf16 workloads, and 80 GB HBM2e per card), RTX 5090 (1× / 2×, newer Blackwell architecture, ideal for inference workloads and rendering), and RTX 4090 (1× / 2× / 4×, cost-effective for Stable Diffusion, LLM inference, and 3D rendering).

Are the GPUs dedicated or shared?

Dedicated. Each plan is a passthrough of the full physical GPU(s), not a slice, not vGPU, not MIG. The CUDA cores, the VRAM, the PCIe bandwidth, all yours. Multi-GPU plans use NVLink where the physical hardware supports it (A100 multi-GPU plans).

Is CUDA pre-installed?

Yes. Every GPU VPS ships with the latest stable CUDA toolkit, cuDNN, and Nvidia drivers pre-baked into the Ubuntu image. PyTorch, TensorFlow, JAX, and the Hugging Face stack run out of the box. You can re-image to a clean Ubuntu without CUDA if you want to install a specific version.

How much VRAM do I get?

Per GPU: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X. Multi-GPU plans aggregate that, a 4× A100 plan has 320 GB total VRAM. The plan list above shows system RAM separately.

Can I run Stable Diffusion / Llama / Whisper on a GPU VPS?

Yes. The 1× RTX 4090 plan is a good starting point: enough VRAM for SDXL inference, Llama 3 70B (4-bit quantized), or Whisper Large. Bump to RTX 5090 or A100 if you need to run unquantized 70B models or train LoRAs.

How does the pricing compare to AWS / Google Cloud / Lambda Labs?

Generally cheaper for steady-state workloads, we don't price-discriminate by 'on-demand' vs 'spot' and we don't have egress fees. We won't quote competitor numbers (those change monthly). The 14-day money-back guarantee lets you A/B against your current provider with your own benchmarks.

Is there an annual discount?

Yes, 35% off annual billing on every GPU plan (lower than the 50% on regular CPU because GPU hardware costs more to amortize). No auto-renewal; you'll get an invoice before each yearly cycle so you can downgrade, upgrade, or cancel without surprise charges.

What about networking? Is it really 40 Gbps?

Yes. Same 40 Gbps uplinks as our flagship Cloud VPS, with no egress fees on monthly transfer up to the plan allowance. Useful for moving large datasets in and out of the GPU node, pulling a 100 GB Hugging Face model takes about 30 seconds at line rate.

Can I run multi-node training (multiple GPU VPS together)?

Yes within a region. VPS in the same datacenter share the local network with sub-millisecond latency. We don't currently offer InfiniBand interconnect, multi-node training over standard Ethernet is fine for fine-tuning and small-scale distributed jobs but isn't competitive with bare-metal HPC for large pre-training.

Money-back guarantee on GPU plans?

14 days, no questions asked. Refund within one billing cycle. Plenty of time to benchmark CUDA throughput, run a real training step, and decide if Cloudzy is the right fit for your workload.

โฮสติ้ง GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Dedicated ทั้งหมด ไม่ใช่แบ่งแบ่ง

Name: Cloudzy GPU VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (728 reviews)

GPU passthrough เต็มรูปแบบ RTX 6000 Pro, A100, RTX 5090, RTX 4090 ติดตั้ง CUDA, cuDNN, PyTorch พร้อมใช้งานทันที
NVMe + เครือข่าย 40 Gbps. Independent cloud ตั้งแต่ปี 2008.

4.6 · 728 reviews on Trustpilot

ปรับใช้ GPU VPS เปรียบเทียบแพลน GPU

เริ่มต้นที่ $506.35/mo · ลด 35% สำหรับรายปี · ไม่ต้องใช้บัตรเครดิต

~ ssh root@gpu-train-001 เชื่อมต่อแล้ว

root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
→ Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS โดยสรุป

Cloudzy จำหน่ายแผน GPU VPS พร้อม RTX 6000 Pro, Nvidia A100, RTX 5090, และ RTX 4090 การ์ดใน 1× ถึง 4× การกำหนดค่า เริ่มต้นที่ $506.35 per month. แต่ละแผนติดตั้ง CUDAล่าสุด, cuDNN, และไดรเวอร์ Nvidia มาพร้อมใช้งาน ทำงานบน AMD EPYC + DDR5 พร้อม NVMe เท่านั้น พื้นที่จัดเก็บและ 40 Gbps uplinks และพร้อมใช้งานภายใน 60 วินาที. GPU เป็น dedicated passthrough ทั้งหมด ไม่ใช่ vGPU, ไม่ใช่ MIG ไม่แชร์ Cloudzy ดำเนินการอย่างอิสระตั้งแต่ 2008 และได้รับการจัดอันดับ 4.6 / 5 by 728+ reviewers บน Trustpilot.

ราคาเริ่มต้น: $506.35 / mo
ประเภท GPU: 6000 Pro · A100 · 5090 · 4090
การตั้งค่า: 1× ถึง 4×
CUDA: ติดตั้งไว้ล่วงหน้า
ส่วนลดรายปี: ลด 35%
คืนเงิน: 14 วัน

ทำไมทีม ML ถึงเลือก Cloudzy

GPU compute ที่ วิธีที่ไม่น่าเบื่อ

สี่เหตุผลที่ทีมย้ายมาใช้ Cloudzy จาก AWS / GCP / hyperscaler GPU

การผ่านทำ GPU เฉพาะเจาะจง

การ์ดฟิสิคัลทั้งใบเป็นของคุณคนเดียว ไม่มีการแบ่ง vGPU ไม่มีการแบ่ง MIG partition และไม่แชร์ทรัพยากรกับ tenant อื่น CUDA cores, VRAM, PCIe lanes ทุกอย่าง dedicated ล้วนๆ

ภาพ CUDA-ready

ไดรเวอร์ Nvidia ล่าสุด, CUDA toolkit และ cuDNN ติดตั้งมาพร้อมใน Ubuntu image แล้ว PyTorch, TensorFlow, JAX, Hugging Face, pip install แล้วเริ่ม training ได้เลย

NVMe + 40 Gbps

storage NVMe เต็มรูปแบบ ไม่ให้การโหลด dataset เป็นคอขวด ระบบเครือข่าย 40 Gbps ทำให้ดึง Hugging Face model ขนาด 100 GB เสร็จภายในไม่กี่วินาที ไม่ใช่นาที

ทีมซัพพอร์ตพร้อมตลอด 24/7

วิศวกรจริงอยู่บน chat เราช่วยทีมต่างๆ ตั้งค่า multi-GPU training, debug CUDA OOM และปรับ Llama inference มามากพอที่จะตอบได้รวดเร็ว

GPU lineup

สี่ครอบครัว
เก้าแบบให้เลือกขยาย

RTX 6000 Pro สำหรับ inference และ rendering ระดับมืออาชีพพร้อม VRAM ECC 48 GB A100 สำหรับ training และ workload ที่ต้องการ VRAM ขนาดใหญ่ RTX 5090 สำหรับ inference รุ่นล่าสุด RTX 4090 สำหรับ inference คุ้มค่าถึง 70B (4-bit) มีแผน multi-GPU ให้เลือก เลือกให้ตรงกับงบ VRAM ของคุณ

GPU passthrough เต็มรูปแบบ ไม่แบ่ง ไม่แชร์

RTX 6000 Pro

48 GB GDDR6 ECC · Pro-grade

Nvidia A100

80 GB HBM2e · ML training

RTX 5090

32 GB GDDR7 · Blackwell

RTX 4090

24 GB GDDR6X · cost-effective

1× ถึง 4× GPU

มีแผน multi-GPU ให้เลือก

CUDA ติดตั้งไว้แล้ว

PyTorch · TF · JAX พร้อม

บริสุทธิ์ NVMe

ชุดข้อมูล I/O ที่รวดเร็ว

40 Gbps uplink

ดึงโมเดล 100 GB ใน 30 วินาที

กรณีการใช้งาน

workload ที่ลูกค้า
ของเราใช้ฝึกโมเดลจริงๆ

การอนุมาน LLM

รัน Llama 3, Mistral, DeepSeek หรือ Qwen ด้วย vLLM หรือ Text Generation Inference RTX 4090 รองรับ 70B ที่ 4-bit, RTX 5090 รองรับ 70B ที่ 8-bit และ A100 รองรับแบบไม่ quantized

Stable Diffusion · สร้างภาพ

รัน SDXL, Flux, หรือ checkpoint ของ Stable Diffusion ที่ fine-tune แล้วด้วย ComfyUI หรือ Automatic1111 RTX 4090 ประมวลผลได้มากกว่า 30 ภาพ/นาที บนขนาด SDXL มาตรฐาน 1024×1024

การฝึกอบรม ML และการปรับแต่งอย่างละเอียด

LoRA, QLoRA, fine-tuning แบบเต็มรูปแบบ A100 คือตัวเลือกที่คุ้มที่สุดสำหรับการ fine-tune โมเดลขนาด 7B-13B แบบไม่ quantize; 4× A100 รองรับโมเดลถึง 70B ด้วยการแบ่ง shard ที่เหมาะสม (FSDP / DeepSpeed)

การเรนเดอร์ 3 มิติ · Blender

Cycles + OptiX บนการ์ด RTX คือวิธีที่เร็วที่สุดสำหรับสตูดิโออนิเมชัน VRAM ขนาด 24 GB บน RTX 4090 รองรับ scene การผลิตแบบ single-frame ได้เกือบทุกประเภท

Speech + vision pipelines ไปป์ไลน์การประมวลผลเสียงและการมองเห็นด้วยคอมพิวเตอร์

Whisper Large, Faster-Whisper, YOLO, Segment Anything แม้แต่แพลน RTX 4090 ก็รัน real-time inference บนโมเดลเหล่านี้ได้สบาย ๆ โดยยังมี headroom เหลืออีกมาก

งาน batch ที่รันต่อเนื่องนาน

สร้าง embedding, retrieval pipelines, หรือ preprocess ชุดข้อมูล จ่ายรายชั่วโมง รันงาน snapshot ผลลัพธ์ แล้วลบเครื่องทิ้ง ถูกกว่าเช่าบน AWS/GCP สำหรับงานในระดับเดียวกัน

80 GB

A100 VRAM

40 Gbps

ลิงก์ขึ้น

CUDA-ready พร้อม

รูปภาพ

4 ×

GPU สูงสุด

35%

ส่วนลดรายปี

14 วัน

คืนเงิน

ราคา

แพลน GPU แนะนำ รายชั่วโมงหรือรายปี

ปัจจุบันการชำระรายปีลด ลด 35% ทุกแพลน GPU

ยอดนิยม

1× RTX 6000 Pro

48 GB GDDR6 ECC VRAM

$845 /เดือน

$1300/mo -35%

Deploy เลย

คืนเงินภายใน 14 วัน

200 GB DDR5
24 vCPU
1.3 TB NVMe NVMe
20 TB · 40 Gbps
CUDA ติดตั้งไว้แล้ว

ดู GPU ทั้ง 9 แพลน (การ์ด 1× ถึง 4×)

คำถามที่พบบ่อย GPU VPS

คำถามที่พบบ่อย คำตอบตรงๆ

Cloudzy มี GPU รุ่นไหนบ้าง?

มี 4 ตระกูล: RTX 6000 Pro (1×, VRAM 48 GB GDDR6 ECC, ระดับ pro สำหรับ inference และ rendering), Nvidia A100 (1× / 2× / 4×, สำหรับ ML training, งาน fp16/bf16 และ HBM2e 80 GB ต่อการ์ด), RTX 5090 (1× / 2×, สถาปัตยกรรม Blackwell รุ่นใหม่ เหมาะกับงาน inference และ rendering) และ RTX 4090 (1× / 2× / 4×, คุ้มค่าสำหรับ Stable Diffusion, inference ของ LLM และ 3D rendering)

GPU เป็นแบบ dedicated หรือ shared?

Dedicated ทุกแพลนใช้ GPU จริงแบบ passthrough เต็มใบ ไม่ใช่ slice ไม่ใช่ vGPU ไม่ใช่ MIG CUDA cores, VRAM และ PCIe bandwidth เป็นของคุณทั้งหมด แพลนที่มีหลาย GPU ใช้ NVLink เมื่อฮาร์ดแวร์รองรับ (แพลน A100 แบบหลาย GPU)

ติดตั้ง CUDA มาให้แล้วหรือเปล่า?

ติดตั้งมาให้แล้ว ทุก GPU VPS มาพร้อม CUDA toolkit เวอร์ชันเสถียรล่าสุด, cuDNN และ Nvidia drivers ที่ฝังไว้ใน image ของ Ubuntu แล้ว PyTorch, TensorFlow, JAX และ Hugging Face stack พร้อมใช้งานทันที หากต้องการติดตั้ง CUDA เวอร์ชันเฉพาะ ก็สามารถ re-image เป็น Ubuntu แบบ clean ที่ไม่มี CUDA ได้

ได้ VRAM เท่าไหร่ต่อการ์ด?

ต่อ GPU หนึ่งใบ: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X แพลนที่มีหลายการ์ดจะรวม VRAM เข้าด้วยกัน เช่น แพลน 4× A100 มี VRAM รวม 320 GB รายการแพลนด้านบนแสดง RAM ของระบบแยกต่างหาก

รัน Stable Diffusion / Llama / Whisper บน GPU VPS ได้ไหม?

ได้ แพลน 1× RTX 4090 เป็นจุดเริ่มต้นที่ดี: VRAM เพียงพอสำหรับ SDXL inference, Llama 3 70B (quantize 4-bit) หรือ Whisper Large หากต้องการรันโมเดล 70B แบบไม่ quantize หรือ train LoRA ให้อัปเกรดเป็น RTX 5090 หรือ A100

ราคาต่างจาก AWS / Google Cloud / Lambda Labs อย่างไร?

โดยทั่วไปแล้วราคาถูกกว่าสำหรับ workload ที่ใช้งานต่อเนื่อง เราไม่แบ่งราคาระหว่าง 'on-demand' กับ 'spot' และไม่มีค่า egress เราไม่ขอเปรียบเทียบตัวเลขของคู่แข่ง เพราะราคาเหล่านั้นเปลี่ยนทุกเดือน แต่การรับประกันคืนเงินภายใน 14 วันช่วยให้คุณทดสอบเทียบกับ provider ปัจจุบันด้วย benchmark ของคุณเองได้

มีส่วนลดสำหรับการชำระรายปีไหม?

ใช่ครับ ลด 35% เมื่อชำระแบบรายปีสำหรับทุกแพลน GPU (น้อยกว่าส่วนลด 50% ของ GPU ทั่วไป เพราะต้นทุนฮาร์ดแวร์ของ GPU สูงกว่าและตัดจ่ายได้ช้ากว่า) ไม่มีการต่ออายุอัตโนมัติ คุณจะได้รับใบแจ้งหนี้ก่อนเริ่มรอบปีใหม่แต่ละครั้ง เพื่อให้สามารถปรับลดแพลน อัปเกรด หรือยกเลิกได้โดยไม่มีค่าใช้จ่ายที่ไม่คาดคิด

เรื่องเครือข่ายล่ะ? 40 Gbps จริงไหม?

ใช่ ใช้การเชื่อมต่อ 40 Gbps เดียวกับ Cloud VPS รุ่นหลักของเรา และไม่มีค่า egress สำหรับการถ่ายโอนข้อมูลรายเดือนในขอบเขตที่แผนกำหนด เหมาะสำหรับการรับส่งชุดข้อมูลขนาดใหญ่เข้าออก node GPU โดยการดึง Hugging Face model ขนาด 100 GB ใช้เวลาประมาณ 30 วินาทีที่ความเร็วสูงสุดของสาย

ฉันสามารถรันการเทรนแบบ multi-node (นำ GPU VPS หลายตัวมาทำงานร่วมกัน) ได้ไหม?

ใช่ ภายในภูมิภาคเดียวกัน VPS ที่อยู่ใน datacenter เดียวกันจะใช้เครือข่าย local ร่วมกัน โดยมี latency ต่ำกว่า 1 มิลลิวินาที ปัจจุบันเรายังไม่รองรับ InfiniBand interconnect การ train แบบ multi-node ผ่าน Ethernet มาตรฐานนั้นเพียงพอสำหรับงาน fine-tuning และ distributed jobs ขนาดเล็ก แต่ไม่สามารถแข่งขันกับ bare-metal HPC สำหรับการ pre-training ขนาดใหญ่ได้

แผน GPU มีการรับประกันคืนเงินหรือไม่?

14 วัน ไม่มีเงื่อนไข คืนเงินภายในรอบบิลถัดไป มีเวลาเพียงพอสำหรับทดสอบประสิทธิภาพ CUDA throughput รัน training จริง และตัดสินใจว่า Cloudzy เหมาะกับ workload ของคุณหรือไม่

หยุดจ่ายค่าบริการแพงเกินจริงกับยักษ์ใหญ่ Cloud ได้แล้ว
ฝึกโมเดลบน GPU เฉพาะของคุณ

เลือกการ์ด เลือกภูมิภาค กดปุ่ม แค่นั้นเอง CUDA ติดตั้งมาให้พร้อมแล้ว