Lewati ke konten utama
diskon 50% semua paket, waktu terbatas. Mulai dari $2.48/mo

Hosting VPS Ollama

Jalankan open-source
LLM di VPS Anda.

VPS siap Ollama dengan AMD EPYC terbaru dan NVMe murni.
Independen sejak 2008. Llama, Mistral, Qwen, DeepSeek, Gemma, semua di bawah IP milikmu.

4.7 · 755 reviews on Trustpilot

Mulai dari $2.48/mo · diskon 50% · Tanpa kartu kredit

~ ssh root@ollama-lon-001 terhubung
root@ollama-lon-001:~# ollama pull llama3
pulling manifest... pulling model 5.0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "What's a VPS?"
A VPS, or Virtual Private Server, is a virtualized
computing environment with its own OS and dedicated
resources, hosted in the cloud...
root@ollama-lon-001:~# _

Ollama VPS sekilas

Cloudzy menyelenggarakan OllamaVPS siap pakai mulai dari 13 region di Amerika Utara, Eropa, Timur Tengah, dan Asia, mulai dari $2.48 per month. Paket berkisar dari 512 MB to 64 GB DDR5, semua di Penyimpanan NVMe dengan 40 Gbps tautan naik Ollama installs in one click; pull Llama 3, Mistral, Qwen, DeepSeek, Gemma dan sajikan di balik API yang kompatibel dengan OpenAIServers provision in (Note: This phrase appears incomplete. If you meant "Servers provision in [location]" or similar, please provide the full text for accurate translation.) If you need a translation for a complete phrase, please share it and I'll translate it to Indonesian. 60 detik. Cloudzy has operated independently since 2008 dan dinilai 4.7 / 5 by 755+ reviewers di Trustpilot.

Harga mulai
$2.48 / month
Penyediaan
60 detik
Wilayah
13 di seluruh dunia
Uptime SLA
99.95%
Uang kembali
14 hari
Didirikan
2008

Kenapa pengembang memilih Cloudzy

Seorang host LLM favorit

Empat hal yang benar-benar dibandingkan pembeli, dikerjakan dengan benar.

Dioptimalkan untuk inferensi

AMD EPYC, storage NVMe-only, memori DDR5, uplinks 40 Gbps. Bobot model dimuat dari NVMe dalam hitungan detik; tanpa disk lambat yang menghambat respons pertama Anda.

Uji coba bebas risiko

Garansi uang kembali 14 hari pada setiap paket. Tanpa pertanyaan. Tanpa biaya setup. Batalkan dari dashboard kapan saja.

SLA uptime 99,95%

Monitoring otomatis di 13 region. SLA 30 hari terakhir dilacak secara publik di status.cloudzy.com, tanpa bersembunyi di balik PR.

Dukungan manusia 24/7

Live chat dan balasan tiket biasanya di bawah 5 menit. Engineer, bukan pembaca skrip. Median resolusi di bawah 1 jam.

Pilih model Anda

Model open-weight.
Satu pull saja.

Llama 3 untuk pilihan aman, Mistral untuk chat umum, Qwen untuk multibahasa, DeepSeek untuk kode, Gemma untuk pekerjaan CPU ringan. Kombinasikan sesuka Anda, semua di NVMe yang sama.

Upload GGUF kustom didukung di setiap paket
Llama 3
8B / 70B / 405B
Mistral
7B / Mixtral 8x7B
Qwen
0,5B – 72B Alibaba
DeepSeek
Coder / Chat / R1
Gemma
2B / 7B Google
Phi
Model kecil Microsoft

Kasus penggunaan

Kenapa pengembang memilih
Ollama VPS milik Cloudzy.

API privat untuk aplikasi Anda

Endpoint kompatibel OpenAI langsung pakai di IP dedicated Anda. Bangun fitur chat, summarizer, atau agen tanpa mengirim prompt pengguna ke penyedia pihak ketiga.

Agen latar belakang

Agen yang berjalan lama untuk memproses email secara batch, scraping situs, atau menandai tiket otomatis tidak cocok dengan API berbasis pemakaian. VPS dengan tarif tetap adalah solusinya. Jadwalkan job dengan cron, panggil Ollama, tunggu, ulangi.

Asisten Kode

Jalankan DeepSeek-Coder atau Qwen-Coder di belakang plugin Continue / Tabby di editor kamu. Autocomplete yang cepat, tanpa biaya per saran, tanpa kode yang dikirim ke vendor.

Demo chat & RAG untuk proyek pribadi

Tarik model, sambungkan Open WebUI atau LibreChat, bagikan link ke teman. Seluruh stack di satu VPS dengan harga beberapa kopi sebulan.

LLM yang ramah kepatuhan

Data sensitif (hukum, kesehatan, dokumen internal) tetap di VPS kamu. Audit akses dengan iptables dan journald, model milik kamu, perimeter milik kamu.

Buat fine-tune sendiri

Tarik base weights, fine-tune di mesin GPU, kirim GGUF kembali ke VPS Ollama CPU untuk inferensi. Biaya serving murah di hari kerja, keluarkan biaya lebih hanya saat training.

60s
Penyediaan
40 Gbps
Tautan naik
NVMe saja
Penyimpanan
13
Wilayah
99.95%
Uptime SLA
14 days
Uang kembali

Jaringan global

13 region. Empat benua.
Pilih yang sesuai, tarik model.

Tempatkan host inferensi kamu dekat dengan pengguna. Latensi median P50 di bawah 10 ms di Amerika Utara dan Eropa.

us-utah-1us-dal-1us-lax-1us-lvg-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Harga

Bayar sesuai pemakaian. Cuma itu.

Per jam, bulanan, atau tahunan. Tanpa biaya egress. Tanpa komitmen. Saat ini diskon 50% semua paket.

1 GB DDR5

Model CPU kecil · 1B–3B

$3.48 /mo
$6.95/mo −50%
Deploy sekarang
Garansi uang kembali 14 hari
  • 1 vCPU @ EPYC
  • 25 GB NVMe
  • 1 TB · 40 Gbps
  • IPv4 + IPv6 dedicated
  • Instalasi Ollama satu klik
2 GB DDR5

7B / 8B pada CPU

$7.475 /mo
$14.95/mo −50%
Deploy sekarang
Garansi uang kembali 14 hari
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • IPv4 + IPv6 dedicated
  • Instalasi Ollama satu klik

FAQ. VPS Ollama

Pertanyaan umum, jawaban lugas.

Apa itu VPS Ollama?

VPS Ollama adalah server cloud Cloudzy yang dikonfigurasi untuk menjalankan Ollama, runtime LLM lokal. Tarik model open-source seperti Llama 3, Mistral, Qwen, DeepSeek, atau Gemma; sajikan melalui API kompatibel OpenAI milik kamu sendiri; bangun aplikasi chat, agen, dan tools tanpa mengirim traffic ke penyedia model pihak ketiga.

Apakah Ollama sudah terinstal?

Ollama tersedia sebagai instalasi satu klik dari panel. Pilih template Linux, binary langsung tersedia di PATH kamu, dan `ollama pull llama3` bisa berjalan dalam satu menit. API HTTP mendengarkan di port 11434 secara default; bind ke IP dedicated kamu di belakang reverse proxy.

Bisakah saya menjalankan LLM di VPS hanya dengan CPU?

Bisa, untuk model yang lebih kecil. Llama 3 8B dan Mistral 7B berjalan di mesin CPU 16 GB, Qwen 0.5B–3B dan Gemma 2B berjalan lancar di 4 GB. Throughput bergantung pada ukuran model dan prompt; CPU lebih lambat dari GPU, tetapi cukup untuk API volume rendah, proyek sampingan, dan pekerjaan pengembangan.

Apakah tersedia paket GPU untuk model yang lebih besar?

Ya. Untuk model kelas 70B atau inferensi throughput tinggi, lihat paket GPU kami (RTX 4090, RTX 5090, A100). 4090 menangani Llama 3 70B dengan kuantisasi; A100 80GB menjalankan model besar dengan presisi penuh. Tersedia di halaman harga.

Apakah API kompatibel OpenAI didukung?

Ya. Ollama mengekspos endpoint `/v1/chat/completions` yang langsung kompatibel dengan klien OpenAI. Arahkan aplikasi kamu yang sudah ada ke `http://your-vps:11434/v1` dan ganti nama model. SDK yang sama, tanpa perlu menulis ulang kode.

Berapa banyak ruang disk yang dibutuhkan sebuah model?

Tergantung modelnya. Model 7B dengan kuantisasi 4-bit berukuran sekitar 4 GB. Model 8B sekitar 5 GB. Model 70B dengan 4-bit sekitar 40 GB. Unduh sebanyak yang muat di storage kamu. Paket tersedia mulai dari 60 GB NVMe hingga 1,5 TB — kamu bisa menjalankan beberapa model sekaligus di satu server.

Seberapa cepat provisioning?

Setelah pembayaran dikonfirmasi, VPS kamu aktif dalam 60 detik. Dengan instalasi satu klik Ollama, runtime siap dalam satu menit berikutnya. Penarikan model pertama membutuhkan waktu lebih lama (tergantung kecepatan jaringan), tapi penarikan berikutnya lebih cepat karena sudah di-cache di NVMe.

Apakah aku dapat IP dedicated?

Ya, setiap VPS dilengkapi dengan IPv4 statis khusus beserta IPv6. Akses API Ollama melalui IP khusus tersebut, pasang reverse proxy Caddy di depannya untuk HTTPS dengan hostname yang proper, dan selesai. Floating IP juga tersedia.

Apakah ada biaya tersembunyi?

Tidak. Egress sudah termasuk dalam jatah transfer bulanan. Snapshot gratis. IPv4 + IPv6 sudah termasuk. Akses root sudah termasuk. Satu-satunya tambahan berbayar adalah Floating IP ($2,50/bulan) dan snapshot tambahan di luar kuota gratis.

Apakah ada garansi uang kembali?

Ya, 14 hari sejak pembelian, tanpa ditanya, refund penuh. Ajukan dari panel atau email [email protected].

Siap saat Anda siap.
ollama run, dalam 60 detik.

Pilih region, klik, tarik model. LLM pribadi kamu, IP khusus kamu.

Tanpa kartu kredit · Garansi uang kembali 14 hari · Batal kapan saja