%50 indirim tüm planlarda, sınırlı süre. Başlangıç fiyatı $2.48/mo

ChatGPT VPS Barındırması

Kendi AI sunucunuz,
kendi kurallarınız.

Açık ağırlıklı LLM'leri ve AI API'lerini kendi sunucunuzda çalıştırın AMD EPYC ile NVMe depolama üzerine inşa edilmiştir.
2008'den beri bağımsız bulut 2008, satıcı bağımlılığı yok, kullanım sınırı yok.
Güvenilen 122,000+ kullanıcılar · şu kaynaktan $2.48/mo.

4.6 · 721 reviews on Trustpilot

Başlangıç fiyatı $2.48/mo · %50 indirim · Kredi kartı gerekmez

~ ssh root@ai-001 bağlandı
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Ollama yükleniyor...
Ollama başarıyla kuruldu.
root@ai-001:~# ollama pull llama3
model llama3 çekiliyor... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS'e kısa bakış

Cloudzy sunar ChatGPT VPS LLM'leri ve AI inference işlemlerini kendi sunucunuzda barındırmak için 12 bölgede, başlangıç fiyatıyla $2.48/mo. Her plan şu altyapı üzerinde çalışır: AMD EPYC ile DDR5 bellek, NVMe depolama ve 40 Gbps uplink. Ollama, llama.cpp, vLLM veya kendi inference stack'inizi kurun; tam root erişimi, API hız sınırı yok. Dakikalar içinde hazır. 60 saniye. 2008'den beri bağımsız; 2008, puan: 4.6/5 by 679+ değerlendirmeci Trustpilot üzerinde.

Başlangıç fiyatı
$2.48 / month
CPU
AMD EPYC · DDR5
Hazırlama
60 saniye
Bölgeler
Dünya genelinde 12 konum
Para iadesi
14 gün
Kuruluş
2008

Geliştiriciler neden Cloudzy'yi seçiyor

Teknik kullanıcıların tercihi.

Kullanıcıların bizi gerçekten karşılaştırdığı dört kriter, eksiksiz karşılanıyor.

Yüksek özellikli altyapı

En yeni nesil AMD EPYC, yalnızca NVMe depolama, DDR5 bellek, 40 Gbps uplink. Her plan katmanında tek iş parçacığı liderliği.

Risksiz deneme

Her planda 14 günlük para iade garantisi. Soru sorulmaz. Kurulum ücreti yok. Dilediğiniz zaman panelden iptal edin.

%99,95 çalışma süresi SLA

12 bölgede otomatik izleme. Son 30 güne ait SLA değerimiz status.cloudzy.com adresinde herkese açık olarak takip edilebilir. Gizli bir şey yok.

7/24 gerçek destek

Canlı sohbet ve destek talepleri genellikle 5 dakika içinde yanıtlanır. Senaryo okuyan değil, mühendis. Medyan çözüm süresi 1 saatin altında.

Kendi sunucunuzda çalıştırabileceğiniz AI araçları

Açık ağırlıklı modeller, altyapınız.

İstediğiniz açık ağırlıklı modeli veya AI framework'ünü çalıştırın. Tam root erişimiyle stack'i, modeli ve servis katmanını siz belirlersiniz. Üçüncü taraf API anahtarı gerekmez.

Ollama
Tek komutla LLM servis etme
llama.cpp
CPU ile optimize edilmiş çıkarım
vLLM
Yüksek verimli servis
WebUI'yi Aç
LLM'ler için sohbet arayüzü
LangChain
Orkestrasyon çerçevesi
Hugging Face
Model merkezi + Transformers

Kullanım senaryoları

Geliştiriciler neden tercih eder
Cloudzy'nin kendi ChatGPT VPS'i.

Özel ChatGPT alternatifi

Llama 3, Mistral veya Phi'yi Open WebUI ile kendi sunucunuzda çalıştırın. Sohbet arayüzü, konuşma geçmişi ve verileriniz VPS'inizden dışarı çıkmaz.

Uygulamanız için API arka ucu

Bir LLM'yi kendi REST API'nizin arkasında çalıştırın. Token başına ücret yok, istek limiti yok. SaaS'niz, botunuz veya dahili araçlarınızla entegre edin.

İnce ayar ve deneyler

Veri setleri yükleyin, LoRA adaptörlerini ince ayarlayın, değerlendirmeler çalıştırın. Kalıcı NVMe depolama sayesinde kontrol noktalarınız yeniden başlatmalardan etkilenmez.

RAG pipeline sunucusu

Yerel bir LLM'yi vektör veritabanıyla (Chroma, Qdrant, Weaviate) birleştirerek retrieval-augmented generation yapın. Her şey tek bir sunucuda.

Çoklu model karşılaştırması

Llama, Mistral ve Phi'yi yan yana çalıştırın. Üretime geçmeden önce çıktıları, gecikmeyi ve kaliteyi karşılaştırın.

Yapay zeka kodlama asistanı

Code Llama veya DeepSeek Coder'yi kendi sunucunuzda barındırın ve yerel bir API aracılığıyla IDE'nize bağlayın. Kod dışarı gönderilmeden otomatik tamamlama ve sohbet.

60s
Hazırlama
40 Gbps
Yükseliş bağlantısı
Yalnızca NVMe
Depolama
12
Bölgeler
99.95%
Çalışma Süresi SLA
14 gün
Para iadesi

Küresel ağ

12 bölge. Dört kıta.
Bir tık uzağında.

ChatGPT VPS'inizi kullanıcılarınıza fiziksel olarak mümkün olduğunca yakın konumlandırın. Kuzey Amerika ve Avrupa'da P50 medyan gecikme 10 ms'nin altında.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Fiyatlandırma

Kullandığın kadar öde. Hepsi bu.

Saatlik, aylık veya yıllık. Çıkış ücreti yok. Taahhüt yok. Şu anda %50 indirim tüm planlar.

512 MB DDR5

Küçük modeller · test

$2.48 /ay
$4.95/mo −%50
Hemen başlat
14 günlük para iadesi
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Ayrılmış IPv4 + IPv6
  • Kök SSH · KVM
2 GB DDR5

Küçük LLM'ler · 7B parametre

$7.475 /ay
$14.95/mo −%50
Hemen başlat
14 günlük para iadesi
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Ayrılmış IPv4 + IPv6
  • Kök SSH · KVM
8 GB DDR5

13B+ modeller · RAG yığınları

$26.475 /ay
$52.95/mo −%50
Hemen başlat
14 günlük para iadesi
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Ayrılmış IPv4 + IPv6
  • Kök SSH · KVM

SSS — ChatGPT VPS

Sık sorulan sorular, net yanıtlar.

ChatGPT'yi kendi VPS'imde çalıştırabilir miyim?

ChatGPT, OpenAI'a ait tescilli bir hizmettir; ancak Llama 3, Mistral, Phi veya DeepSeek gibi açık ağırlıklı alternatifleri kendi Cloudzy VPS'inizde barındırabilirsiniz. Ollama ve Open WebUI gibi araçlar, tam gizlilikle benzer bir sohbet deneyimi sunar.

LLM çıkarımı için ne kadar RAM'a ihtiyacım var?

Model boyutuna bağlıdır. 7B parametreli bir model (örneğin kuantize Llama 3 8B), 4-8 GB RAM ile çalışır. 13B model 8-16 GB gerektirir. 70B gibi büyük modeller ise 32-64 GB ister. Küçük modeller için 4 GB planla başlayın, gerektiğinde yükseltin.

LLM çalıştırmak için GPU şart mı?

Hayır. llama.cpp ve Ollama gibi araçlar, AMD EPYC üzerinde CPU ile çıkarım yapmak için optimize edilmiştir. GPU'ye kıyasla saniye başına token hızı daha düşük olur; ancak kişisel kullanım, küçük ekipler veya asenkron toplu işler için CPU çıkarımı gayet yeterli çalışır ve GPU barındırmanın çok daha küçük bir maliyetiyle.

Birden fazla modeli aynı anda barındırabilir miyim?

Evet. Yeterli RAM ile Ollama veya vLLM üzerinden birden fazla model çalıştırabilir ve aralarında geçiş yapabilirsiniz. Her model, talep üzerine belleğe yüklenir. 16 GB plan, 2-3 küçük modeli aynı anda rahatlıkla sunabilir.

Veri gizliliği ne durumda?

Her şey kendi VPS'nizde kalır. Üçüncü taraf API'lere hiçbir veri gönderilmez. Model, veri ve ağ tamamen sizin kontrolünüzde. Bu, barındırılan AI servislerine karşı en büyük avantajdır: prompt'larınız ve yanıtlarınız sunucunuzu hiç terk etmez.

Ollama nasıl kurulur?

Tek komutla: curl -fsSL https://ollama.ai/install.sh | sh. Ardından ollama pull llama3 ile modeli çekin ve sohbete başlayın. Temiz bir VPS üzerinde tüm süreç 5 dakikadan kısa sürer.

LLM'imi bir API olarak dışarıya açabilir miyim?

Evet. Ollama, varsayılan olarak 11434 portu üzerinde OpenAI uyumlu bir API sunar. vLLM da OpenAI uyumlu bir endpoint açar. Uygulamanızı, botunuzu veya frontend'inizi VPS'nizin IP ve portuna yönlendirmeniz yeterli.

Çalışma süresi garantisi nedir?

Cloudzy, tüm planlarda %99,95 çalışma süresi SLA sunar. AI sunucunuz, yedekli ağ yolları ve 40 Gbps bağlantıyla 7/24 çevrimiçi kalır.

Bu VPS üzerinde model ince ayarı yapabilir miyim?

CPU ile ince ayar mümkündür ancak yavaştır. Küçük modellerin (7B) LoRA/QLoRA ince ayarı için yüksek RAM'li bir CPU planı deneme amaçlı işe yarar. Büyük modellerin üretim ortamında ince ayarı için GPU örnekleri daha pratiktir.

Para iade politikası nedir?

14 gün içinde soru sorulmadan para iadesi. AI kurulumunuzu test edin, çıkarım hızını ölçün, kararınızı verin. Tam iade için paneli veya desteği kullanın.

Hazır olduğunuzda başlayalım.
AI sunucusu 60 saniyede.

Kredi kartı gerekmez · 14 günlük para iade garantisi · İstediğiniz zaman iptal edin