%50 indirim tüm planlarda, sınırlı süre. Başlangıç fiyatı $2.48/mo

Ollama VPS Hosting

Açık kaynak
LLM'leri kendi VPS'nizde çalıştırın.

En yeni AMD EPYC ve saf NVMe ile Ollama'ye hazır VPS.
Independent since 2008. Llama, Mistral, Qwen, DeepSeek, Gemma, hepsi kendi IP'niz altında.

4.6· Trustpilot'de 713 değerlendirme

Başlangıç fiyatı $2.48/mo · %50 indirim · Kredi kartı gerekmez

~ ssh root@ollama-lon-001bağlandı
root@ollama-lon-001:~# ollama pull llama3
manifest alınıyor... model indiriliyor 5.0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "VPS nedir?"
VPS ya da Virtual Private Server, kendi işletim sistemi ve
ayrılmış kaynakları olan, bulutta barındırılan
sanallaştırılmış bir bilişim ortamıdır...
root@ollama-lon-001:~# _

Ollama VPS'a Genel Bakış

Cloudzy sunucu Ollama-ready VPS'ler 12 bölgede Kuzey Amerika, Avrupa, Orta Doğu ve Asya genelinde, başlangıç fiyatıyla $2.48 per month. Planlar 512 MB to 64 GB DDR5, all on NVMe depolama alanı ile 40 Gbps uplink'ler. Ollama tek tıkla kurulur; Llama 3, Mistral, Llama 3, Mistral, Qwen, DeepSeek, Gemma modellerini çalıştırın ve bir OpenAI uyumlu API. Servers provision in 60 saniye. Cloudzy, 2008 yılından beri bağımsız olarak faaliyet göstermekte olup değerlendirmesi 4.6 / 5 by 713'ten fazla değerlendirici Trustpilot üzerinde.

Başlangıç fiyatı
$2.48 / month
Hazırlama
60 saniye
Bölgeler
Dünya genelinde 12 konum
Uptime SLA
99.95%
Para iadesi
14 gün
Kuruluş
2008

Geliştiriciler neden Cloudzy'yi seçiyor

An LLM host tercihi.

Kullanıcıların bizi gerçekten karşılaştırdığı dört kriter, eksiksiz karşılanıyor.

Çıkarım için optimize edilmiş

AMD EPYC, yalnızca NVMe depolama, DDR5 bellek, 40 Gbps uplink. Model ağırlıkları NVMe'den saniyeler içinde yüklenir; ilk yanıtı yavaşlatan disk darbesi olmaz.

Risksiz deneme

Her planda 14 günlük para iade garantisi. Soru sorulmaz. Kurulum ücreti alınmaz. İstediğiniz zaman panelden iptal edin.

%99,95 çalışma süresi SLA

12 bölgede otomatik izleme. Son 30 günlük SLA, status.cloudzy.com adresinde kamuya açık takip edilir; PR arkasına sığınılmaz.

7/24 gerçek destek

Canlı sohbet ve destek talepleri genellikle 5 dakika içinde yanıtlanır. Senaryo okuyan değil, mühendis. Medyan çözüm süresi 1 saatin altında.

Modelinizi seçin

Açık ağırlıklı modeller.
Tek pull ile hazır.

Güvenli tercih için Llama 3, genel sohbet için Mistral, çok dilli kullanım için Qwen, kod için DeepSeek, küçük CPU işleri için Gemma. İstediğinizi karıştırın, hepsi aynı NVMe üzerinde.

Her planda özel GGUF yükleme desteği
Llama 3
8B / 70B / 405B
Mistral
7B / Mixtral 8x7B
Qwen
0.5B – 72B Alibaba
DeepSeek
Coder / Chat / R1
Gemma
2B / 7B Google
Phi
Microsoft küçük modeller

Kullanım senaryoları

Geliştiriciler neden tercih eder
Cloudzy'nin Ollama VPS'ı.

Uygulamanız için özel API

Kendi IP'nize atanmış, OpenAI uyumlu bir endpoint. Kullanıcı promptlarını üçüncü taraf sağlayıcılara göndermeden sohbet özellikleri, özetleyiciler veya ajan sistemleri geliştirin.

Background agents

E-postaları toplu işleyen, site tarayan veya biletleri otomatik etiketleyen uzun süreli ajanlar, kullanım başı fiyatlı API'lere sığmaz. Sabit ücretli bir VPS sığar. Bir cron job kurun, Ollama'e istek atın, bekleyin, tekrarlayın.

Code assistants

Editörünüzdeki Continue / Tabby eklentisinin arkasına DeepSeek-Coder veya Qwen-Coder çalıştırın. Hızlı otomatik tamamlama, öneri başına maliyet yok, kod üçüncü tarafa gönderilmez.

Hobi sohbet botu ve RAG demoları

Bir model çekin, Open WebUI veya LibreChat bağlayın, arkadaşlarınızla bir bağlantı paylaşın. Tüm yığın tek bir VPS üzerinde, aylık birkaç kahve fiyatına.

Uyumluluk dostu LLM'ler

Hassas veriler (hukuki, sağlık, dahili belgeler) VPS'nizde kalır. iptables ve journald ile erişimi denetleyin; model sizin, çevre sizin.

Kendi ince ayarlarınızı yapın

Temel ağırlıkları çekin, bir GPU makinesinde ince ayar yapın, GGUF'u çıkarım için bir CPU Ollama VPS'ye gönderin. Hafta içi düşük maliyetle sunun, yalnızca eğitirken harcayın.

60s
Hazırlama
40 Gbps
Uplink
Yalnızca NVMe
Depolama
12
Bölgeler
99.95%
Uptime SLA
14 gün
Para iadesi

Küresel ağ

12 bölge. Dört kıta.
Size uygun olanı seçin, modeli çekin.

Çıkarım sunucunuzu kullanıcılarınıza yakın konuşlandırın. Kuzey Amerika ve Avrupa'da ortanca P50 gecikme süresi 10 ms'nin altında.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

Fiyatlandırma

Kullandığın kadar öde. Hepsi bu.

Saatlik, aylık veya yıllık. Çıkış ücreti yok. Taahhüt yok. Şu anda %50 indirim tüm planlar.

1 GB DDR5

Küçük CPU modeller · 1B–3B

$3.48/ay
$6.95/mo−50%
Hemen başlat
14 günlük para iadesi
  • 1 vCPU @ EPYC
  • 25 GB NVMe
  • 1 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Tek tıkla Ollama
2 GB DDR5

7B / 8B on CPU

$7.475/ay
$14.95/mo−50%
Hemen başlat
14 günlük para iadesi
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Tek tıkla Ollama

SSS. Ollama VPS

Sık sorulan sorular, net yanıtlar.

Ollama VPS nedir?

Ollama VPS, yerel LLM çalışma zamanı olan Ollama'yi çalıştırmak üzere yapılandırılmış bir Cloudzy bulut sunucusudur. Llama 3, Mistral, Qwen, DeepSeek veya Gemma gibi açık kaynaklı modeller çekin; bunları kendi OpenAI uyumlu API'nizin arkasında sunun; üçüncü taraf bir model sağlayıcısına trafik göndermeden sohbet uygulamaları, ajanlar ve araçlar geliştirin.

Ollama önceden yüklü mü?

Ollama, panelden tek tıklamayla kurulabilir. Bir Linux şablonu seçin; binary PATH'inize eklenir ve `ollama pull llama3` bir dakika içinde çalışır. HTTP API varsayılan olarak 11434 portunu dinler; bunu bir ters proxy arkasında özel IP'nize bağlayın.

Yalnızca CPU olan bir VPS'de LLM çalıştırabilir miyim?

Evet, küçük modeller için. Llama 3 8B ve Mistral 7B, 16 GB CPU'li bir makinede çalışır; Qwen 0.5B–3B ve Gemma 2B ise 4 GB'da rahatça çalışır. Çıktı hızı modelin ve komutun boyutuna bağlıdır. CPU, GPU'den yavaştır ancak düşük hacimli API'ler, yan projeler ve geliştirme işleri için yeterlidir.

Daha büyük modeller için GPU planlarınız var mı?

Evet. 70B sınıfı modeller veya yüksek hacimli çıkarım için GPU planlarımıza bakın (RTX 4090, RTX 5090, A100). 4090, niceleme ile Llama 3 70B'yi kaldırır; A100 80 GB ise tam hassasiyetli büyük modelleri çalıştırır. Fiyatlandırma sayfasında bağlantıya ulaşabilirsiniz.

OpenAI uyumlu API destekleniyor mu?

Evet. Ollama, OpenAI istemcisiyle doğrudan uyumlu bir `/v1/chat/completions` uç noktası sunar. Mevcut uygulamanızı `http://your-vps:11434/v1` adresine yönlendirin ve model adını değiştirin. Aynı SDK, yeniden yazım gerekmez.

Bir model ne kadar disk alanı kaplar?

Duruma göre değişir. 4-bit kuantize edilmiş 7B model yaklaşık 4 GB tutar. 8B model yaklaşık 5 GB, 70B model 4-bit'te ise ~40 GB'dır. Depolama alanınız el verdiğince model indirin. Planlar NVMe ile 60 GB'tan başlar ve 1,5 TB'a kadar çıkar; aynı sunucuda istediğiniz modelleri bir arada kullanabilirsiniz.

Sağlama ne kadar sürer?

Ödeme onaylandıktan sonra VPS'niz 60 saniye içinde hazır olur. Ollama tek tıklamayla kurulunca çalışma ortamı bir dakika içinde ayağa kalkar. İlk model indirme ağ hızına bağlı olduğundan biraz uzun sürebilir; sonrakiler ise NVMe üzerinde önbellekte hazır gelir.

Do I get a dedicated IP?

Evet, her VPS ile birlikte statik bir IPv4 ve IPv6 verilir. Ollama API'sine bu IP üzerinden ulaşabilir, gerçek bir alan adında HTTPS için önüne bir Caddy ters proxy koyabilirsiniz; bu kadar. Kayan IP'ler de mevcuttur.

Gizli ücretler var mı?

Hayır. Çıkış trafiği aylık transfer kotanıza dahildir. Anlık görüntüler ücretsizdir. IPv4 ve IPv6 dahildir. Root erişimi dahildir. Ücretli tek ekstralar Floating IP'ler (2,50 $/ay) ve ücretsiz kotayı aşan ek anlık görüntülerdir.

Para iade garantisi var mı?

Evet, satın alma tarihinden itibaren 14 gün içinde herhangi bir gerekçe aranmaksızın tam iade yapılır. Panel üzerinden ya da [email protected] adresine e-posta göndererek talepte bulunabilirsiniz.

Hazır olduğunuzda başlayalım.
ollama run, 60 saniyede.

Bir bölge seçin, tıklayın, model indirin. Kendi özel LLM'niz, size ait bir IP.

Kredi kartı gerekmez · 14 günlük para iade garantisi · İstediğiniz zaman iptal edin