ข้ามไปยังเนื้อหาหลัก
ลด 50% ทุกแพลน เวลาจำกัด เริ่มต้นที่ $2.48/mo

Ollama บริการโฮสติง VPS

รัน open-source
LLM บน VPS ของคุณ

VPS พร้อมใช้กับ Ollama บน AMD EPYC รุ่นล่าสุดและ NVMe แท้
เป็นอิสระตั้งแต่ปี 2008 Llama, Mistral, Qwen, DeepSeek, Gemma ทั้งหมดอยู่ภายใต้ IP ของคุณ

4.7 · 755 reviews on Trustpilot

เริ่มต้นที่ $2.48/mo · ลด 50% · ไม่ต้องใช้บัตรเครดิต

~ ssh root@ollama-lon-001 เชื่อมต่อแล้ว
root@ollama-lon-001:~# ollama pull llama3
pulling manifest... pulling model 5.0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "What's a VPS?"
A VPS, or Virtual Private Server, is a virtualized
computing environment with its own OS and dedicated
resources, hosted in the cloud...
root@ollama-lon-001:~# _

ภาพรวม Ollama VPS

Cloudzy โฮสต์ OllamaVPS พร้อมใช้งานตั้งแต่ 13 region ทั่วอเมริกาเหนือ ยุโรป ตะวันออกกลาง และเอเชีย เริ่มต้นที่ $2.48 per month. แพลนตั้งแต่ 512 MB to 64 GB DDR5, ทั้งหมดบน NVMe storage พร้อม 40 Gbps ลิงก์อัพสตรีม Ollama installs in one click; pull Llama 3, Mistral, Qwen, DeepSeek, Gemma และให้บริการผ่าน OpenAI ที่เข้ากันได้ APIเซิร์ฟเวอร์จัดสรรใน 60 วินาที. Cloudzy has operated independently since 2008 และได้คะแนน 4.7 / 5 by 755+ reviewers บน Trustpilot

ราคาเริ่มต้น
$2.48 / month
การจัดสรรทรัพยากร
60 วินาที
ภูมิภาค
13 แห่งทั่วโลก
Uptime SLA
99.95%
คืนเงิน
14 วัน
ก่อตั้ง
2008

ทำไมนักพัฒนาเลือก Cloudzy

เจ้าภาพ LLM นักพัฒนา

สี่สิ่งที่ผู้ซื้อใช้เปรียบเทียบเรา ทำอย่างถูกต้อง

ปรับแต่งมาสำหรับ inference

AMD EPYC, พื้นที่เก็บข้อมูลแบบ NVMe เท่านั้น, หน่วยความจำ DDR5, uplinks ขนาด 40 Gbps โหลด model weights จาก NVMe ได้ภายในไม่กี่วินาที ไม่มีดิสก์ช้าที่ทำให้ response แรกสะดุด

ทดลองใช้แบบไม่มีความเสี่ยง

รับประกันคืนเงิน 14 วันทุกแพ็กเกจ ไม่ถามคำถาม ไม่มีค่าติดตั้ง ยกเลิกได้ทุกเมื่อจากแดชบอร์ด

99.95% uptime SLA

มอนิเตอริงอัตโนมัติครอบคลุม 13 region ดู SLA 30 วันล่าสุดได้ที่ status.cloudzy.com แบบเปิดเผย ไม่ซ่อนหลังคำพีอาร์

ฝ่ายสนับสนุนมนุษย์จริง 24/7

Live chat และตอบ ticket มักภายใน 5 นาที วิศวกรจริง ไม่ใช่คนอ่านสคริปต์ แก้ปัญหาเฉลี่ยภายใน 1 ชั่วโมง

เลือก model ของคุณ

โมเดลแบบเปิด
Pull เดียว พร้อมใช้งาน

Llama 3 สำหรับตัวเลือกที่ไว้ใจได้, Mistral สำหรับแชททั่วไป, Qwen สำหรับงานหลายภาษา, DeepSeek สำหรับโค้ด, Gemma สำหรับงาน CPU ขนาดเล็ก ผสมผสานได้ตามต้องการ ทั้งหมดอยู่บน NVMe เดียวกัน

รองรับการอัปโหลด GGUF แบบกำหนดเองในทุกแผน
Llama 3
8B / 70B / 405B
Mistral
7B / Mixtral 8x7B
Qwen
0.5B – 72B Alibaba
DeepSeek
Coder / Chat / R1
Gemma
2B / 7B Google
Phi
โมเดลเล็ก Microsoft

กรณีการใช้งาน

ทำไมนักพัฒนาเลือก
API Ollama VPS ของ Cloudzy

API ส่วนตัวสำหรับแอปของคุณ

Endpoint แบบ OpenAI-compatible บน IP เฉพาะของคุณ สร้างฟีเจอร์แชท ระบบสรุปข้อความ หรือ agents ได้โดยไม่ต้องส่ง prompt ของผู้ใช้ไปยังผู้ให้บริการภายนอก

เอเจนต์พื้นหลัง

Agent ที่ทำงานต่อเนื่องและประมวลผลอีเมลเป็นชุด ดึงข้อมูลจากเว็บ หรือแท็ก ticket อัตโนมัติ ไม่เหมาะกับ API แบบคิดราคาตามการใช้งาน แต่ VPS แบบค่าบริการคงที่ตอบโจทย์ได้ดี ตั้ง Cron job, เรียก Ollama, พักเครื่อง, วนซ้ำ

ผู้ช่วยเขียนโค้ด

รัน DeepSeek-Coder หรือ Qwen-Coder เบื้องหลังปลั๊กอิน Continue หรือ Tabby ของ editor คุณ Autocomplete ฉับไว ไม่มีค่าใช้จ่ายรายครั้ง และโค้ดไม่ถูกส่งออกไปยัง vendor

แชทสำหรับ hobby และ demo RAG

Pull model มา เชื่อมต่อกับ Open WebUI หรือ LibreChat แล้วแชร์ลิงก์ให้เพื่อน ทั้ง stack อยู่บน VPS เดียว ในราคาแค่กาแฟไม่กี่แก้วต่อเดือน

LLM ที่เป็นมิตรต่อข้อกำหนดการปฏิบัติตามกฎระเบียบ

ข้อมูลที่ละเอียดอ่อน ไม่ว่าจะเป็นด้านกฎหมาย สาธารณสุข หรือเอกสารภายใน จะอยู่บน VPS ของคุณเท่านั้น ตรวจสอบการเข้าถึงด้วย iptables และ journald ทุกอย่างอยู่ใน perimeter ของคุณ

สร้าง fine-tune ของคุณเอง

Pull base weights มา fine-tune บนเครื่อง GPU แล้วนำ GGUF กลับไปรันบน Ollama VPS แบบ CPU สำหรับ inference ประหยัดค่าใช้จ่ายในวันธรรมดา จ่ายเพิ่มเฉพาะตอน train เท่านั้น

60s
การจัดสรรทรัพยากร
40 Gbps
ลิงก์ขึ้น
NVMe เท่านั้น
พื้นที่จัดเก็บข้อมูล
13
ภูมิภาค
99.95%
Uptime SLA
14 days
คืนเงิน

เครือข่ายทั่วโลก

13 region 4 ทวีป
เลือกแผนของคุณ แล้ว pull model

วาง inference host ไว้ใกล้กับผู้ใช้ของคุณ P50 latency เฉลี่ยต่ำกว่า 10 ms ในอเมริกาเหนือและยุโรป

us-utah-1us-dal-1us-lax-1us-lvg-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

ราคา

จ่ายเท่าที่ใช้ แค่นั้นเอง

รายชั่วโมง รายเดือน หรือรายปี ไม่มีค่า egress ไม่ผูกมัด ขณะนี้ ลด 50% ทุกแพลน

1 GB DDR5

โมเดล CPU ขนาดเล็ก · 1B–3B

$3.48 /mo
$6.95/mo −50%
ติดตั้งเลย
คืนเงินภายใน 14 วัน
  • 1 vCPU @ EPYC
  • 25 GB NVMe
  • 1 TB · 40 Gbps
  • IPv4 + IPv6 เฉพาะของคุณ
  • ติดตั้ง Ollama ด้วยคลิกเดียว
2 GB DDR5

7B / 8B บน CPU

$7.475 /mo
$14.95/mo −50%
ติดตั้งเลย
คืนเงินภายใน 14 วัน
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • IPv4 + IPv6 เฉพาะของคุณ
  • ติดตั้ง Ollama ด้วยคลิกเดียว

คำถามที่พบบ่อย Ollama VPS

คำถามที่พบบ่อย คำตอบตรงไปตรงมา

Ollama VPS คืออะไร?

Ollama VPS คือเซิร์ฟเวอร์คลาวด์ Cloudzy ที่ตั้งค่ามาเพื่อรัน Ollama ซึ่งเป็น runtime สำหรับ LLM แบบโลคัล ดึงโมเดล open-source อย่าง Llama 3, Mistral, Qwen, DeepSeek หรือ Gemma มาใช้งาน, เปิด API ที่เข้ากันได้กับ OpenAI บนเซิร์ฟเวอร์ของคุณเอง, และสร้างแอปแชท, agent, รวมถึงเครื่องมือต่าง ๆ โดยไม่ต้องส่ง traffic ไปยังผู้ให้บริการโมเดลภายนอก

มี Ollama ติดตั้งไว้ให้แล้วหรือไม่?

Ollama ติดตั้งได้ด้วยคลิกเดียวจาก panel เลือก template Linux, ไฟล์ binary จะอยู่ใน PATH ทันที และ `ollama pull llama3` พร้อมใช้งานภายในหนึ่งนาที API HTTP จะ listen บนพอร์ต 11434 ตามค่าเริ่มต้น และสามารถผูก IP เฉพาะไว้หลัง reverse proxy ได้

รัน LLM บน VPS ที่มีแค่ CPU ได้ไหม?

ได้ สำหรับโมเดลขนาดเล็ก Llama 3 8B และ Mistral 7B รันได้บนเครื่องที่มี CPU 16 GB, Qwen 0.5B–3B และ Gemma 2B รันได้สบาย ๆ บน 4 GB throughput ขึ้นอยู่กับขนาดโมเดลและ prompt; CPU ช้ากว่า GPU แต่เพียงพอสำหรับ API ที่ไม่ได้ใช้งานหนัก, side project, และงาน dev

มีแพลน GPU สำหรับโมเดลขนาดใหญ่ด้วยไหม?

มี สำหรับโมเดลระดับ 70B หรือ inference ที่ต้องการ throughput สูง ดูแพลน GPU ของเราได้ที่ RTX 4090, RTX 5090, A100 การ์ด 4090 รอง Llama 3 70B แบบ quantization ได้, ส่วน A100 80GB รันโมเดลขนาดใหญ่แบบ full-precision ดูราคาเพิ่มเติมได้ที่หน้า pricing

รองรับ API ที่เข้ากันได้กับ OpenAI หรือไม่?

รองรับ Ollama เปิด endpoint `/v1/chat/completions` ที่ใช้แทน OpenAI client ได้ทันที เพียงชี้แอปที่มีอยู่ไปที่ `http://your-vps:11434/v1` แล้วเปลี่ยนชื่อโมเดล ใช้ SDK เดิมได้เลย ไม่ต้องแก้โค้ด

โมเดลหนึ่งตัวใช้ disk เท่าไหร่?

ขึ้นอยู่กับโมเดล โมเดล 7B แบบ 4-bit quantized ใช้ประมาณ 4 GB, 8B ใช้ประมาณ 5 GB, 70B แบบ 4-bit ใช้ประมาณ 40 GB ดึงมาเท่าที่พื้นที่จะรองรับได้ แพลนเริ่มต้นที่ NVMe 60 GB และขยายได้ถึง 1.5 TB รัน mix โมเดลหลายตัวบนเครื่องเดียวได้

การจัดเตรียมเร็วแค่ไหน?

เมื่อยืนยันการชำระเงินแล้ว VPS ของคุณจะพร้อมใช้งานภายใน 60 วินาที เมื่อติดตั้ง Ollama ด้วยคลิกเดียว runtime จะพร้อมในอีกหนึ่งนาที การดึงโมเดลครั้งแรกจะใช้เวลานานกว่า (ขึ้นอยู่กับเครือข่าย) แต่ครั้งถัดไปจะโหลดจาก cache บน NVMe ได้เลย

ฉันได้ IP เฉพาะไหม?

ทุก VPS มาพร้อม IP สแตติกเฉพาะและ IPv6 เข้าถึง API ของ Ollama ผ่าน IP เฉพาะ, ติดตั้ง reverse proxy Caddy ด้านหน้าเพื่อใช้ HTTPS บน hostname จริง เท่านี้ก็พร้อมใช้งาน รองรับ Floating IP ด้วย

มีค่าธรรมเนียมแอบแฝงไหม?

ไม่มี Egress รวมอยู่ในโควต้า transfer รายเดือนของคุณ Snapshots ฟรี IPv4 + IPv6 รวมอยู่ด้วย การเข้าถึง root รวมอยู่ด้วย ส่วนเสริมที่ต้องจ่ายมีเพียง Floating IPs ($2.50/เดือน) และ snapshots เพิ่มเติมเกินโควต้าฟรี

มีการรับประกันคืนเงินไหม?

ใช่ 14 วันนับจากซื้อ ไม่ต้องถาม คืนเต็มจำนวน ขอได้จากแผงควบคุมหรืออีเมล [email protected]

พร้อมเมื่อคุณพร้อม
ollama run, ใน 60 วินาที

เลือก region, กดคลิก, ดึงโมเดล IP เฉพาะและ LLM ส่วนตัวของคุณ

ไม่ต้องใช้บัตรเครดิต · คืนเงินภายใน 14 วัน · ยกเลิกได้ทุกเมื่อ