ลด 50% ทุกแพ็กเกจ เวลาจำกัด เริ่มต้นที่ $2.48/mo

โฮสติ้ง ChatGPT VPS

เซิร์ฟเวอร์ AI ของคุณเอง
กฎของคุณเอง

Self-host open-weight LLMs และ AI APIs บน AMD EPYC พร้อม NVMe ที่รวดเร็ว
ให้บริการ cloud อิสระตั้งแต่ 2008, ไม่ผูกขาดกับเจ้าใด, ไม่จำกัดการใช้งาน
เชื่อถือโดย 122,000+ ผู้ใช้ · จาก $2.48/mo.

4.6 · 721 reviews on Trustpilot

เริ่มต้นที่ $2.48/mo · ลด 50% · ไม่ต้องใช้บัตรเครดิต

~ ssh root@ai-001 เชื่อมต่อแล้ว
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
กำลังติดตั้ง Ollama...
ติดตั้ง Ollama สำเร็จแล้ว
root@ai-001:~# ollama pull llama3
กำลังดึงโมเดล llama3... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS โดยสรุป

Cloudzy มอบให้ ChatGPT VPS โฮสติ้งสำหรับ self-hosting และการรัน AI inference 12 ภูมิภาคเริ่มต้นที่ $2.48/mo. ทุกแพ็กเกจรันบน AMD EPYC พร้อม DDR5 หน่วยความจำ NVMe พื้นที่จัดเก็บข้อมูล และ 40 Gbps uplinks. ติดตั้ง Ollama, llama.cpp, vLLM, หรือ inference stack ของคุณเอง พร้อม root access เต็มรูปแบบ ไม่มีการจำกัด rate limits ของ API เริ่มใช้งานได้ใน 60 วินาที. เป็นอิสระมาตั้งแต่ 2008 คะแนน 4.6/5 by 679+ ผู้รีวิว บน Trustpilot.

ราคาเริ่มต้น
$2.48 / month
CPU
AMD EPYC · DDR5
การจัดสรรทรัพยากร
60 วินาที
ภูมิภาค
12 แห่งทั่วโลก
คืนเงิน
14 วัน
ก่อตั้ง
2008

ทำไมนักพัฒนาถึงเลือก Cloudzy

ที่ชื่นชอบของ นักพัฒนา

สี่สิ่งที่ผู้ใช้เปรียบเทียบเราจริงๆ และเราทำได้ครบทุกข้อ

โครงสร้างพื้นฐานสเปคสูง

AMD EPYC รุ่นล่าสุด, สตอเรจ NVMe ล้วน, แรม DDR5, อัปลิงก์ 40 Gbps ประสิทธิภาพ Single-thread นำหน้าทุกระดับแพลน

ทดลองใช้โดยไม่มีความเสี่ยง

รับประกันคืนเงินภายใน 14 วันทุกแพ็กเกจ ไม่ต้องให้เหตุผล ไม่มีค่าติดตั้ง ยกเลิกได้ตลอดเวลาจากแดชบอร์ด

Uptime 99.95% SLA

ติดตามการทำงานอัตโนมัติใน 12 ภูมิภาค ค่า SLA ย้อนหลัง 30 วันของเราเปิดเผยต่อสาธารณะที่ status.cloudzy.com ไม่มีปิดบัง

ทีมซัพพอร์ตพร้อมตลอด 24/7

แชทสดและตอบกลับตั๋วโดยเฉลี่ยภายใน 5 นาที ดูแลโดยวิศวกร ไม่ใช่การตอบตามสคริปต์ เวลาแก้ไขปัญหาเฉลี่ยไม่เกิน 1 ชั่วโมง

เครื่องมือ AI ที่คุณโฮสต์เองได้

โมเดลแบบเปิดน้ำหนัก โครงสร้างพื้นฐานของคุณ

รัน open-weight model หรือ AI framework ใดก็ได้ที่ต้องการ Root เต็มรูปแบบ หมายความว่าคุณเลือก stack, model และ serving layer ได้เอง ไม่จำเป็นต้องใช้ API key จากบุคคลที่สาม

Ollama
การเสิร์ฟ LLM ด้วยคำสั่งเดียว
llama.cpp
การ inference ที่ปรับแต่งสำหรับ CPU
vLLM
การให้บริการแบบปริมาณงานสูง
เปิด WebUI
อินเทอร์เฟซแชทสำหรับ LLMs
LangChain
กรอบการจัดการและประสานงาน
Hugging Face
ศูนย์รวมโมเดล + Transformers

กรณีการใช้งาน

ทำไมนักพัฒนาถึงเลือก
ChatGPT ของ Cloudzy VPS

ทางเลือก ChatGPT แบบส่วนตัว

รัน Llama 3, Mistral, หรือ Phi บนเซิร์ฟเวอร์ของคุณเองผ่าน Open WebUI พร้อมหน้าแชทและประวัติการสนทนา โดยข้อมูลทั้งหมดอยู่บนเซิร์ฟเวอร์ของคุณเท่านั้น

API แบ็กเอนด์สำหรับแอปของคุณ

ให้บริการ LLM บน REST API ของคุณเอง ไม่มีค่าบริการรายโทเค็น ไม่มีการจำกัด rate limits เชื่อมต่อกับ SaaS, บอต, หรือเครื่องมือภายในองค์กรได้ทันที

การ fine-tune และทดสอบโมเดล

อัปโหลด dataset, fine-tune LoRA adapters, รัน eval ได้เลย พื้นที่เก็บข้อมูล NVMe แบบ persistent ทำให้ checkpoint ของคุณยังอยู่ครบแม้รีบูตเครื่อง

เซิร์ฟเวอร์ RAG pipeline

รวม LLM แบบ local เข้ากับ vector DB (Chroma, Qdrant, Weaviate) เพื่อทำ retrieval-augmented generation ทุกอย่างอยู่บนเครื่องเดียวกัน

เปรียบเทียบหลายโมเดลพร้อมกัน

รัน Llama, Mistral, และ Phi คู่ขนานกัน เปรียบเทียบผลลัพธ์ ความหน่วง และคุณภาพก่อนเลือกใช้โมเดลใดโมเดลหนึ่งใน production

ผู้ช่วยเขียนโค้ดด้วย AI

Self-host Code Llama หรือ DeepSeek Coder แล้วเชื่อมต่อกับ IDE ผ่าน API แบบ local เขียนโค้ดด้วย auto-complete และแชทได้โดยไม่ต้องส่งโค้ดออกไปภายนอก

60s
การจัดสรรทรัพยากร
40 Gbps
ลิงก์ขึ้น
NVMe เท่านั้น
พื้นที่จัดเก็บข้อมูล
12
ภูมิภาค
99.95%
เวลาทำงาน SLA
14 วัน
คืนเงิน

เครือข่ายทั่วโลก

12 ภูมิภาค. สี่ทวีป.
ไม่กี่คลิกก็พร้อมใช้งาน

วาง ChatGPT VPS ของคุณให้ใกล้ผู้ใช้มากที่สุดเท่าที่จะเป็นไปได้ latency P50 ต่ำกว่า 10 ms ในอเมริกาเหนือและยุโรป

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

ราคา

จ่ายเฉพาะที่ใช้จริง แค่นั้นเอง

รายชั่วโมง รายเดือน หรือรายปี ไม่มีค่าธรรมเนียมข้อมูลขาออก ไม่มีสัญญาผูกมัด ขณะนี้ ลด 50% ทุกแพลน

512 MB DDR5

โมเดลขนาดเล็ก · ทดสอบระบบ

$2.48 /เดือน
$4.95/mo −50%
Deploy เลย
คืนเงินภายใน 14 วัน
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • IPv4 + IPv6 เฉพาะ
  • Root SSH · KVM
2 GB DDR5

LLM ขนาดเล็ก · 7B params

$7.475 /เดือน
$14.95/mo −50%
Deploy เลย
คืนเงินภายใน 14 วัน
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • IPv4 + IPv6 เฉพาะ
  • Root SSH · KVM
8 GB DDR5

โมเดล 13B+ · RAG stacks

$26.475 /เดือน
$52.95/mo −50%
Deploy เลย
คืนเงินภายใน 14 วัน
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • IPv4 + IPv6 เฉพาะ
  • Root SSH · KVM

คำถามที่พบบ่อย — ChatGPT VPS

คำถามที่พบบ่อย คำตอบตรงๆ

รัน ChatGPT บน VPS ของตัวเองได้ไหม?

ChatGPT เป็นบริการเฉพาะของ OpenAI แต่คุณสามารถ self-host โมเดลแบบ open-weight ที่ทำงานใกล้เคียงกัน เช่น Llama 3, Mistral, Phi, หรือ DeepSeek บน Cloudzy VPS ของคุณได้ เครื่องมืออย่าง Ollama และ Open WebUI มอบประสบการณ์การแชทที่คล้ายกัน พร้อมความเป็นส่วนตัวเต็มรูปแบบ

ต้องการ RAM เท่าไหร่สำหรับการ inference ด้วย LLM?

ขึ้นอยู่กับขนาดของโมเดล โมเดล 7B parameters (เช่น Llama 3 8B แบบ quantized) ใช้ RAM ประมาณ 4-8 GB โมเดล 13B ต้องการ 8-16 GB ส่วนโมเดลขนาดใหญ่ 70B ต้องการถึง 32-64 GB เริ่มต้นด้วยแพ็กเกจ 4 GB สำหรับโมเดลขนาดเล็ก แล้วเพิ่มขึ้นตามความต้องการ

จำเป็นต้องมี GPU เพื่อรัน LLM ไหม?

ไม่จำเป็น เครื่องมืออย่าง llama.cpp และ Ollama ได้รับการปรับให้ทำ CPU inference บน AMD EPYC ได้โดยตรง ความเร็ว tokens-per-second จะช้ากว่า GPU แต่สำหรับการใช้งานส่วนตัว ทีมขนาดเล็ก หรืองาน async batch ก็ทำงานได้ดีและมีค่าใช้จ่ายต่ำกว่าการ host แบบ GPU มาก

โฮสต์หลายโมเดลพร้อมกันได้ไหม?

ได้ ถ้ามี RAM เพียงพอ คุณสามารถรันหลายโมเดลพร้อมกันผ่าน Ollama หรือ vLLM และสลับใช้งานระหว่างโมเดลได้ แต่ละโมเดลจะโหลดเข้า memory เมื่อมีการเรียกใช้ แพ็กเกจ 16 GB รองรับโมเดลขนาดเล็กได้สบาย 2-3 โมเดลพร้อมกัน

ความเป็นส่วนตัวของข้อมูลเป็นอย่างไร?

ข้อมูลทั้งหมดอยู่บน VPS ของคุณเท่านั้น ไม่มีการส่งข้อมูลไปยัง API ของบุคคลที่สาม คุณควบคุมโมเดล ข้อมูล และเครือข่ายได้ทั้งหมด นี่คือข้อได้เปรียบหลักเมื่อเทียบกับบริการ AI แบบ hosted ทั้ง prompt และคำตอบจะไม่ออกจากเซิร์ฟเวอร์ของคุณเลย

วิธีติดตั้ง Ollama

คำสั่งเดียว: curl -fsSL https://ollama.ai/install.sh | sh จากนั้น pull โมเดลด้วย ollama pull llama3 แล้วเริ่มใช้งานได้เลย ทั้งหมดนี้ใช้เวลาไม่ถึง 5 นาทีบนเครื่อง VPS ที่เพิ่งตั้งค่าใหม่

ฉันสามารถเปิดเผย LLM ของฉันในรูปแบบ API ได้ไหม?

ใช่ Ollama เปิด API ที่รองรับ OpenAI ไว้ที่พอร์ต 11434 โดยค่าเริ่มต้น vLLM ก็มี endpoint ที่รองรับ OpenAI เช่นกัน เพียงชี้แอป บอต หรือ frontend ของคุณไปที่ IP และพอร์ตของ VPS

อัปไทม์รับประกันเท่าไหร่?

Cloudzy รับประกัน uptime 99.95% ในทุกแพลน เซิร์ฟเวอร์ AI ของคุณออนไลน์ตลอด 24 ชั่วโมงด้วยเครือข่ายสำรองและการเชื่อมต่อ 40 Gbps

ฉันสามารถ fine-tune โมเดลบน VPS นี้ได้ไหม?

การ fine-tuning บน CPU ทำได้แต่ใช้เวลานาน สำหรับการ fine-tuning แบบ LoRA/QLoRA บนโมเดลขนาดเล็ก (7B) แพลน CPU ที่มี RAM สูงเหมาะสำหรับการทดลอง สำหรับการ fine-tuning โมเดลขนาดใหญ่ในระดับ production อินสแตนซ์ GPU เป็นตัวเลือกที่ใช้งานได้จริงกว่า

นโยบายคืนเงินเป็นอย่างไร?

รับประกันคืนเงินภายใน 14 วัน ไม่มีเงื่อนไข ทดสอบ AI ของคุณ วัดความเร็ว inference ตัดสินใจได้เลย ขอคืนเงินได้ทันทีผ่านแดชบอร์ดหรือติดต่อฝ่ายซัพพอร์ต

พร้อมให้บริการทุกเมื่อที่คุณต้องการ
เซิร์ฟเวอร์ AI ใน 60 วินาที

ไม่ต้องใช้บัตรเครดิต · รับประกันคืนเงินภายใน 14 วัน · ยกเลิกได้ทุกเมื่อ