diskon 50% semua paket, waktu terbatas. Mulai dari $2.48/mo

Hosting VPS Ollama

Jalankan open-source
LLM di VPS Anda.

VPS siap Ollama dengan AMD EPYC terbaru dan NVMe murni.
Independen sejak 2008. Llama, Mistral, Qwen, DeepSeek, Gemma, semua di bawah IP milikmu.

4.6· 735 reviews on Trustpilot

Dimulai dari $2.48/mo · Diskon 50% · Tanpa kartu kredit

~ ssh root@ollama-lon-001terhubung
root@ollama-lon-001:~# ollama pull llama3
menarik manifes... menarik model 5.0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "Apa itu VPS?"
VPS, atau Virtual Private Server, adalah lingkungan
komputasi virtual dengan OS dan resource
tersendiri, dihosting di cloud...
root@ollama-lon-001:~# _

Ollama VPS sekilas

Cloudzy menyelenggarakan OllamaVPS siap pakai mulai dari 12 wilayah di Amerika Utara, Eropa, Timur Tengah, dan Asia, mulai dari $2.48 per month. Paket tersedia mulai dari 512 MB to 64 GB DDR5, semua di Penyimpanan NVMe dengan 40 Gbps uplinks. Ollama terinstal dalam satu klik; pull Llama 3, Mistral, Qwen, DeepSeek, Gemma dan sajikan di balik API yang kompatibel dengan OpenAIServers provision in (Note: This phrase appears incomplete. If you meant "Servers provision in [location]" or similar, please provide the full text for accurate translation.) If you need a translation for a complete phrase, please share it and I'll translate it to Indonesian. 60 detik. Cloudzy beroperasi secara independen sejak 2008 dan mendapat rating 4.6 / 5 by 735+ reviewers di Trustpilot.

Harga mulai
$2.48 / month
Penyediaan
60 detik
Wilayah
12 di seluruh dunia
Waktu Aktif SLA
99.95%
Uang kembali
14 hari
Didirikan
2008

Mengapa developer memilih Cloudzy

Seorang host LLM favorit

Empat hal yang benar-benar dibandingkan pembeli, dan kami lakukan dengan benar.

Dioptimalkan untuk inferensi

AMD EPYC, storage NVMe-only, memori DDR5, uplinks 40 Gbps. Bobot model dimuat dari NVMe dalam hitungan detik; tanpa disk lambat yang menghambat respons pertama Anda.

Coba tanpa risiko

Garansi uang kembali 14 hari untuk semua paket. Tanpa pertanyaan. Tanpa biaya setup. Batalkan kapan saja dari dashboard.

Jaminan Waktu Aktif 99.95% SLA

Pemantauan otomatis di 12 region. SLA 30 hari terakhir dipantau secara publik di status.cloudzy.com, tanpa disembunyikan.

Dukungan manusia 24/7

Live chat dan balasan tiket biasanya di bawah 5 menit. Ditangani oleh engineer, bukan pembaca skrip. Median penyelesaian masalah di bawah 1 jam.

Pilih model Anda

Model open-weight.
Satu pull saja.

Llama 3 untuk pilihan aman, Mistral untuk chat umum, Qwen untuk multibahasa, DeepSeek untuk kode, Gemma untuk pekerjaan CPU ringan. Kombinasikan sesuka Anda, semua di NVMe yang sama.

Upload GGUF kustom didukung di setiap paket
Llama 3
8B / 70B / 405B
Mistral
7B / Mixtral 8x7B
Qwen
0,5B – 72B Alibaba
DeepSeek
Coder / Chat / R1
Gemma
2B / 7B Google
Phi
Model kecil Microsoft

Kasus penggunaan

Mengapa para developer memilih
Ollama VPS milik Cloudzy.

API privat untuk aplikasi Anda

Endpoint kompatibel OpenAI langsung pakai di IP dedicated Anda. Bangun fitur chat, summarizer, atau agen tanpa mengirim prompt pengguna ke penyedia pihak ketiga.

Agen latar belakang

Agen yang berjalan lama untuk memproses email secara batch, scraping situs, atau menandai tiket otomatis tidak cocok dengan API berbasis pemakaian. VPS dengan tarif tetap adalah solusinya. Jadwalkan job dengan cron, panggil Ollama, tunggu, ulangi.

Asisten Kode

Jalankan DeepSeek-Coder atau Qwen-Coder di belakang plugin Continue / Tabby di editor kamu. Autocomplete yang cepat, tanpa biaya per saran, tanpa kode yang dikirim ke vendor.

Demo chat & RAG untuk proyek pribadi

Tarik model, sambungkan Open WebUI atau LibreChat, bagikan link ke teman. Seluruh stack di satu VPS dengan harga beberapa kopi sebulan.

LLM yang ramah kepatuhan

Data sensitif (hukum, kesehatan, dokumen internal) tetap di VPS kamu. Audit akses dengan iptables dan journald, model milik kamu, perimeter milik kamu.

Buat fine-tune sendiri

Tarik base weights, fine-tune di mesin GPU, kirim GGUF kembali ke VPS Ollama CPU untuk inferensi. Biaya serving murah di hari kerja, keluarkan biaya lebih hanya saat training.

60s
Penyediaan
40 Gbps
Tautan naik
NVMe saja
Penyimpanan
12
Wilayah
99.95%
Waktu Aktif SLA
14 hari
Uang kembali

Jaringan Global

12 region. Empat benua.
Pilih yang sesuai, tarik model.

Tempatkan host inferensi kamu dekat dengan pengguna. Latensi median P50 di bawah 10 ms di Amerika Utara dan Eropa.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

Harga

Bayar sesuai penggunaan. Itu saja.

Per jam, per bulan, atau per tahun. Tanpa biaya egress. Tanpa komitmen. Saat ini diskon 50% semua paket.

1 GB DDR5

Model CPU kecil · 1B–3B

$3.48/bln
$6.95/mo−50%
Terapkan sekarang
Uang kembali 14 hari
  • 1 vCPU @ EPYC
  • 25 GB NVMe
  • 1 TB · 40 Gbps
  • Dedicated IPv4 + IPv6 Khusus
  • Instalasi Ollama satu klik
2 GB DDR5

7B / 8B pada CPU

$7.475/bln
$14.95/mo−50%
Terapkan sekarang
Uang kembali 14 hari
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedicated IPv4 + IPv6 Khusus
  • Instalasi Ollama satu klik

FAQ. VPS Ollama

Pertanyaan umum jawaban langsung.

Apa itu VPS Ollama?

VPS Ollama adalah server cloud Cloudzy yang dikonfigurasi untuk menjalankan Ollama, runtime LLM lokal. Tarik model open-source seperti Llama 3, Mistral, Qwen, DeepSeek, atau Gemma; sajikan melalui API kompatibel OpenAI milik kamu sendiri; bangun aplikasi chat, agen, dan tools tanpa mengirim traffic ke penyedia model pihak ketiga.

Apakah Ollama sudah terinstal?

Ollama tersedia sebagai instalasi satu klik dari panel. Pilih template Linux, binary langsung tersedia di PATH kamu, dan `ollama pull llama3` bisa berjalan dalam satu menit. API HTTP mendengarkan di port 11434 secara default; bind ke IP dedicated kamu di belakang reverse proxy.

Bisakah saya menjalankan LLM di VPS hanya dengan CPU?

Bisa, untuk model yang lebih kecil. Llama 3 8B dan Mistral 7B berjalan di mesin CPU 16 GB, Qwen 0.5B–3B dan Gemma 2B berjalan lancar di 4 GB. Throughput bergantung pada ukuran model dan prompt; CPU lebih lambat dari GPU, tetapi cukup untuk API volume rendah, proyek sampingan, dan pekerjaan pengembangan.

Apakah tersedia paket GPU untuk model yang lebih besar?

Ya. Untuk model kelas 70B atau inferensi throughput tinggi, lihat paket GPU kami (RTX 4090, RTX 5090, A100). 4090 menangani Llama 3 70B dengan kuantisasi; A100 80GB menjalankan model besar dengan presisi penuh. Tersedia di halaman harga.

Apakah API kompatibel OpenAI didukung?

Ya. Ollama mengekspos endpoint `/v1/chat/completions` yang langsung kompatibel dengan klien OpenAI. Arahkan aplikasi kamu yang sudah ada ke `http://your-vps:11434/v1` dan ganti nama model. SDK yang sama, tanpa perlu menulis ulang kode.

Berapa banyak ruang disk yang dibutuhkan sebuah model?

Tergantung modelnya. Model 7B dengan kuantisasi 4-bit berukuran sekitar 4 GB. Model 8B sekitar 5 GB. Model 70B dengan 4-bit sekitar 40 GB. Unduh sebanyak yang muat di storage kamu. Paket tersedia mulai dari 60 GB NVMe hingga 1,5 TB — kamu bisa menjalankan beberapa model sekaligus di satu server.

Seberapa cepat proses provisioningnya?

Setelah pembayaran dikonfirmasi, VPS kamu aktif dalam 60 detik. Dengan instalasi satu klik Ollama, runtime siap dalam satu menit berikutnya. Penarikan model pertama membutuhkan waktu lebih lama (tergantung kecepatan jaringan), tapi penarikan berikutnya lebih cepat karena sudah di-cache di NVMe.

Apakah saya mendapatkan IP yang didedikasikan?

Ya, setiap VPS dilengkapi dengan IPv4 statis khusus beserta IPv6. Akses API Ollama melalui IP khusus tersebut, pasang reverse proxy Caddy di depannya untuk HTTPS dengan hostname yang proper, dan selesai. Floating IP juga tersedia.

Ada biaya tersembunyi?

Tidak. Egress sudah termasuk dalam kuota transfer bulanan kamu. Snapshot gratis. IPv4 + IPv6 sudah termasuk. Akses root sudah termasuk. Satu-satunya tambahan berbayar adalah Floating IP ($2,50/bulan) dan snapshot tambahan di luar kuota gratis.

Apakah ada jaminan uang kembali?

Ya, 14 hari sejak pembelian, tanpa pertanyaan, refund penuh. Ajukan melalui panel atau kirim email ke [email protected].

Siap saat kamu siap.
ollama run, dalam 60 detik.

Pilih region, klik, tarik model. LLM pribadi kamu, IP khusus kamu.

Tidak perlu kartu kredit · Garansi uang kembali 14 hari · Batalkan kapan saja