ลด 50% ทุกแพ็กเกจ เวลาจำกัด เริ่มต้นที่ $2.48/mo

โฮสติ้ง GPU VPS

RTX 6000 Pro. A100. RTX 5090.
Dedicated ทั้งหมด ไม่ใช่แบ่งแบ่ง

GPU passthrough เต็มรูปแบบ RTX 6000 Pro, A100, RTX 5090, RTX 4090 ติดตั้ง CUDA, cuDNN, PyTorch พร้อมใช้งานทันที
NVMe + เครือข่าย 40 Gbps. Independent cloud ตั้งแต่ปี 2008.

4.6 · 728 reviews on Trustpilot

เริ่มต้นที่ $506.35/mo · ลด 35% สำหรับรายปี · ไม่ต้องใช้บัตรเครดิต

~ ssh root@gpu-train-001 เชื่อมต่อแล้ว
root@gpu-train-001:~# nvidia-smi --query-gpu=name,memory.total,driver_version --format=csv
name, memory.total, driver_version
NVIDIA RTX 6000 Pro, 49152 MiB, 560.94
root@gpu-train-001:~# python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))"
True NVIDIA RTX 6000 Pro
root@gpu-train-001:~# python train.py --model llama-3-8b --epochs 3
Training step 1/2400 · 4.2s/step · loss=2.143
root@gpu-train-001:~# _

GPU VPS โดยสรุป

Cloudzy จำหน่ายแผน GPU VPS พร้อม RTX 6000 Pro, Nvidia A100, RTX 5090, และ RTX 4090 การ์ดใน 1× ถึง 4× การกำหนดค่า เริ่มต้นที่ $506.35 per month. แต่ละแผนติดตั้ง CUDAล่าสุด, cuDNN, และไดรเวอร์ Nvidia มาพร้อมใช้งาน ทำงานบน AMD EPYC + DDR5 พร้อม NVMe เท่านั้น พื้นที่จัดเก็บและ 40 Gbps uplinks และพร้อมใช้งานภายใน 60 วินาที. GPU เป็น dedicated passthrough ทั้งหมด ไม่ใช่ vGPU, ไม่ใช่ MIG ไม่แชร์ Cloudzy ดำเนินการอย่างอิสระตั้งแต่ 2008 และได้รับการจัดอันดับ 4.6 / 5 by 728+ reviewers บน Trustpilot.

ราคาเริ่มต้น
$506.35 / mo
ประเภท GPU
6000 Pro · A100 · 5090 · 4090
การตั้งค่า
1× ถึง 4×
CUDA
ติดตั้งไว้ล่วงหน้า
ส่วนลดรายปี
ลด 35%
คืนเงิน
14 วัน

ทำไมทีม ML ถึงเลือก Cloudzy

GPU compute ที่ วิธีที่ไม่น่าเบื่อ

สี่เหตุผลที่ทีมย้ายมาใช้ Cloudzy จาก AWS / GCP / hyperscaler GPU

การผ่านทำ GPU เฉพาะเจาะจง

การ์ดฟิสิคัลทั้งใบเป็นของคุณคนเดียว ไม่มีการแบ่ง vGPU ไม่มีการแบ่ง MIG partition และไม่แชร์ทรัพยากรกับ tenant อื่น CUDA cores, VRAM, PCIe lanes ทุกอย่าง dedicated ล้วนๆ

ภาพ CUDA-ready

ไดรเวอร์ Nvidia ล่าสุด, CUDA toolkit และ cuDNN ติดตั้งมาพร้อมใน Ubuntu image แล้ว PyTorch, TensorFlow, JAX, Hugging Face, pip install แล้วเริ่ม training ได้เลย

NVMe + 40 Gbps

storage NVMe เต็มรูปแบบ ไม่ให้การโหลด dataset เป็นคอขวด ระบบเครือข่าย 40 Gbps ทำให้ดึง Hugging Face model ขนาด 100 GB เสร็จภายในไม่กี่วินาที ไม่ใช่นาที

ทีมซัพพอร์ตพร้อมตลอด 24/7

วิศวกรจริงอยู่บน chat เราช่วยทีมต่างๆ ตั้งค่า multi-GPU training, debug CUDA OOM และปรับ Llama inference มามากพอที่จะตอบได้รวดเร็ว

GPU lineup

สี่ครอบครัว
เก้าแบบให้เลือกขยาย

RTX 6000 Pro สำหรับ inference และ rendering ระดับมืออาชีพพร้อม VRAM ECC 48 GB A100 สำหรับ training และ workload ที่ต้องการ VRAM ขนาดใหญ่ RTX 5090 สำหรับ inference รุ่นล่าสุด RTX 4090 สำหรับ inference คุ้มค่าถึง 70B (4-bit) มีแผน multi-GPU ให้เลือก เลือกให้ตรงกับงบ VRAM ของคุณ

GPU passthrough เต็มรูปแบบ ไม่แบ่ง ไม่แชร์
RTX 6000 Pro
48 GB GDDR6 ECC · Pro-grade
Nvidia A100
80 GB HBM2e · ML training
RTX 5090
32 GB GDDR7 · Blackwell
RTX 4090
24 GB GDDR6X · cost-effective
1× ถึง 4× GPU
มีแผน multi-GPU ให้เลือก
CUDA ติดตั้งไว้แล้ว
PyTorch · TF · JAX พร้อม
บริสุทธิ์ NVMe
ชุดข้อมูล I/O ที่รวดเร็ว
40 Gbps uplink
ดึงโมเดล 100 GB ใน 30 วินาที

กรณีการใช้งาน

workload ที่ลูกค้า
ของเราใช้ฝึกโมเดลจริงๆ

การอนุมาน LLM

รัน Llama 3, Mistral, DeepSeek หรือ Qwen ด้วย vLLM หรือ Text Generation Inference RTX 4090 รองรับ 70B ที่ 4-bit, RTX 5090 รองรับ 70B ที่ 8-bit และ A100 รองรับแบบไม่ quantized

Stable Diffusion · สร้างภาพ

รัน SDXL, Flux, หรือ checkpoint ของ Stable Diffusion ที่ fine-tune แล้วด้วย ComfyUI หรือ Automatic1111 RTX 4090 ประมวลผลได้มากกว่า 30 ภาพ/นาที บนขนาด SDXL มาตรฐาน 1024×1024

การฝึกอบรม ML และการปรับแต่งอย่างละเอียด

LoRA, QLoRA, fine-tuning แบบเต็มรูปแบบ A100 คือตัวเลือกที่คุ้มที่สุดสำหรับการ fine-tune โมเดลขนาด 7B-13B แบบไม่ quantize; 4× A100 รองรับโมเดลถึง 70B ด้วยการแบ่ง shard ที่เหมาะสม (FSDP / DeepSpeed)

การเรนเดอร์ 3 มิติ · Blender

Cycles + OptiX บนการ์ด RTX คือวิธีที่เร็วที่สุดสำหรับสตูดิโออนิเมชัน VRAM ขนาด 24 GB บน RTX 4090 รองรับ scene การผลิตแบบ single-frame ได้เกือบทุกประเภท

Speech + vision pipelines ไปป์ไลน์การประมวลผลเสียงและการมองเห็นด้วยคอมพิวเตอร์

Whisper Large, Faster-Whisper, YOLO, Segment Anything แม้แต่แพลน RTX 4090 ก็รัน real-time inference บนโมเดลเหล่านี้ได้สบาย ๆ โดยยังมี headroom เหลืออีกมาก

งาน batch ที่รันต่อเนื่องนาน

สร้าง embedding, retrieval pipelines, หรือ preprocess ชุดข้อมูล จ่ายรายชั่วโมง รันงาน snapshot ผลลัพธ์ แล้วลบเครื่องทิ้ง ถูกกว่าเช่าบน AWS/GCP สำหรับงานในระดับเดียวกัน

80 GB
A100 VRAM
40 Gbps
ลิงก์ขึ้น
CUDA-ready พร้อม
รูปภาพ
4 ×
GPU สูงสุด
35%
ส่วนลดรายปี
14 วัน
คืนเงิน

ราคา

แพลน GPU แนะนำ รายชั่วโมงหรือรายปี

ปัจจุบันการชำระรายปีลด ลด 35% ทุกแพลน GPU

คำถามที่พบบ่อย GPU VPS

คำถามที่พบบ่อย คำตอบตรงๆ

Cloudzy มี GPU รุ่นไหนบ้าง?

มี 4 ตระกูล: RTX 6000 Pro (1×, VRAM 48 GB GDDR6 ECC, ระดับ pro สำหรับ inference และ rendering), Nvidia A100 (1× / 2× / 4×, สำหรับ ML training, งาน fp16/bf16 และ HBM2e 80 GB ต่อการ์ด), RTX 5090 (1× / 2×, สถาปัตยกรรม Blackwell รุ่นใหม่ เหมาะกับงาน inference และ rendering) และ RTX 4090 (1× / 2× / 4×, คุ้มค่าสำหรับ Stable Diffusion, inference ของ LLM และ 3D rendering)

GPU เป็นแบบ dedicated หรือ shared?

Dedicated ทุกแพลนใช้ GPU จริงแบบ passthrough เต็มใบ ไม่ใช่ slice ไม่ใช่ vGPU ไม่ใช่ MIG CUDA cores, VRAM และ PCIe bandwidth เป็นของคุณทั้งหมด แพลนที่มีหลาย GPU ใช้ NVLink เมื่อฮาร์ดแวร์รองรับ (แพลน A100 แบบหลาย GPU)

ติดตั้ง CUDA มาให้แล้วหรือเปล่า?

ติดตั้งมาให้แล้ว ทุก GPU VPS มาพร้อม CUDA toolkit เวอร์ชันเสถียรล่าสุด, cuDNN และ Nvidia drivers ที่ฝังไว้ใน image ของ Ubuntu แล้ว PyTorch, TensorFlow, JAX และ Hugging Face stack พร้อมใช้งานทันที หากต้องการติดตั้ง CUDA เวอร์ชันเฉพาะ ก็สามารถ re-image เป็น Ubuntu แบบ clean ที่ไม่มี CUDA ได้

ได้ VRAM เท่าไหร่ต่อการ์ด?

ต่อ GPU หนึ่งใบ: RTX 6000 Pro = 48 GB GDDR6 ECC, A100 = 80 GB HBM2e, RTX 5090 = 32 GB GDDR7, RTX 4090 = 24 GB GDDR6X แพลนที่มีหลายการ์ดจะรวม VRAM เข้าด้วยกัน เช่น แพลน 4× A100 มี VRAM รวม 320 GB รายการแพลนด้านบนแสดง RAM ของระบบแยกต่างหาก

รัน Stable Diffusion / Llama / Whisper บน GPU VPS ได้ไหม?

ได้ แพลน 1× RTX 4090 เป็นจุดเริ่มต้นที่ดี: VRAM เพียงพอสำหรับ SDXL inference, Llama 3 70B (quantize 4-bit) หรือ Whisper Large หากต้องการรันโมเดล 70B แบบไม่ quantize หรือ train LoRA ให้อัปเกรดเป็น RTX 5090 หรือ A100

ราคาต่างจาก AWS / Google Cloud / Lambda Labs อย่างไร?

โดยทั่วไปแล้วราคาถูกกว่าสำหรับ workload ที่ใช้งานต่อเนื่อง เราไม่แบ่งราคาระหว่าง 'on-demand' กับ 'spot' และไม่มีค่า egress เราไม่ขอเปรียบเทียบตัวเลขของคู่แข่ง เพราะราคาเหล่านั้นเปลี่ยนทุกเดือน แต่การรับประกันคืนเงินภายใน 14 วันช่วยให้คุณทดสอบเทียบกับ provider ปัจจุบันด้วย benchmark ของคุณเองได้

มีส่วนลดสำหรับการชำระรายปีไหม?

ใช่ครับ ลด 35% เมื่อชำระแบบรายปีสำหรับทุกแพลน GPU (น้อยกว่าส่วนลด 50% ของ GPU ทั่วไป เพราะต้นทุนฮาร์ดแวร์ของ GPU สูงกว่าและตัดจ่ายได้ช้ากว่า) ไม่มีการต่ออายุอัตโนมัติ คุณจะได้รับใบแจ้งหนี้ก่อนเริ่มรอบปีใหม่แต่ละครั้ง เพื่อให้สามารถปรับลดแพลน อัปเกรด หรือยกเลิกได้โดยไม่มีค่าใช้จ่ายที่ไม่คาดคิด

เรื่องเครือข่ายล่ะ? 40 Gbps จริงไหม?

ใช่ ใช้การเชื่อมต่อ 40 Gbps เดียวกับ Cloud VPS รุ่นหลักของเรา และไม่มีค่า egress สำหรับการถ่ายโอนข้อมูลรายเดือนในขอบเขตที่แผนกำหนด เหมาะสำหรับการรับส่งชุดข้อมูลขนาดใหญ่เข้าออก node GPU โดยการดึง Hugging Face model ขนาด 100 GB ใช้เวลาประมาณ 30 วินาทีที่ความเร็วสูงสุดของสาย

ฉันสามารถรันการเทรนแบบ multi-node (นำ GPU VPS หลายตัวมาทำงานร่วมกัน) ได้ไหม?

ใช่ ภายในภูมิภาคเดียวกัน VPS ที่อยู่ใน datacenter เดียวกันจะใช้เครือข่าย local ร่วมกัน โดยมี latency ต่ำกว่า 1 มิลลิวินาที ปัจจุบันเรายังไม่รองรับ InfiniBand interconnect การ train แบบ multi-node ผ่าน Ethernet มาตรฐานนั้นเพียงพอสำหรับงาน fine-tuning และ distributed jobs ขนาดเล็ก แต่ไม่สามารถแข่งขันกับ bare-metal HPC สำหรับการ pre-training ขนาดใหญ่ได้

แผน GPU มีการรับประกันคืนเงินหรือไม่?

14 วัน ไม่มีเงื่อนไข คืนเงินภายในรอบบิลถัดไป มีเวลาเพียงพอสำหรับทดสอบประสิทธิภาพ CUDA throughput รัน training จริง และตัดสินใจว่า Cloudzy เหมาะกับ workload ของคุณหรือไม่

หยุดจ่ายค่าบริการแพงเกินจริงกับยักษ์ใหญ่ Cloud ได้แล้ว
ฝึกโมเดลบน GPU เฉพาะของคุณ

เลือกการ์ด เลือกภูมิภาค กดปุ่ม แค่นั้นเอง CUDA ติดตั้งมาให้พร้อมแล้ว

ไม่ต้องใช้บัตรเครดิต · รับประกันคืนเงินภายใน 14 วัน · ยกเลิกได้ทุกเมื่อ