%50 indirim tüm planlarda, sınırlı süre. Başlangıç fiyatı $2.48/mo

Yapay Zeka VPS Barındırması

AI iş yükleri,
şeklini seç.

Çıkarım / RAG için yüksek RAM CPU ya da eğitim için NVIDIA sınıfı GPU, hepsi aynı VPS panelinden.
2008'den bu yana bağımsız bulut. Aylık $2.48'dan başlar · 60 saniyede root SSH.

4.6 · 728 reviews on Trustpilot

CPU'den $2.48/mo · GPU planlarında fiyatlandırma · 14 günlük para iade garantisi

~ ssh root@ai-nyc-001 bağlandı
root@ai-nyc-001:~# curl -fsSL https://ollama.com/install.sh | sh
Ollama çalışma zamanı yükleniyor... tamamlandı
root@ai-nyc-001:~# ollama run llama3.1:8b-instruct-q4
manifest alınıyor · 4.7 GB NVMe'ye indiriliyor
model hazır · CPU çıkarımı başlıyor
root@ai-nyc-001:~# curl localhost:11434/api/generate -d '...'
{"response":"Merhaba! Bugün size nasıl yardımcı olabilirim?"}
root@ai-nyc-001:~# _

AI VPS'ye genel bakış

Cloudzy iki farklı yapılandırmayla AI VPS barındırma hizmeti sunar: nicelleştirilmiş LLM çıkarımı, RAG ve pipeline'lar için yüksek RAM CPU planları ve NVIDIA sınıfı GPU eğitim ve büyük model sunumu için planlar. Planlar şu ortamda çalışır: AMD EPYC, NVMe depolama alanı, ve 40 Gbps üzerinden bağlantı hatları 12 bölgede. CPU fiyatı başlangıç olarak $2.48 per month; kurulum süresi 60 saniye; CUDA görüntüleri GPU planlarında önceden yüklenmiş olarak gelir. Cloudzy, bağımsız olarak hizmet vermektedir - 2008yılından bu yana bağımsız olarak faaliyet göstermekte olup hizmet verdiği 122.000'den fazla geliştiricive puanı 4.6 / 5 by 728+ reviewers Trustpilot üzerinde.

CPU fiyatı şu kadardan başlar
$2.48 / month
GPU türleri
RTX · Pro
Hazırlama
60 saniye
Bölgeler
Dünya genelinde 12 konum
Çalışma Süresi SLA
99.95%
Para iadesi
14 gün

Yapay zeka geliştiricileri neden Cloudzy'yi seçiyor?

Yapay zekayı yayına alan bulut.

AI iş yükünüzün burada olması için dört neden.

AMD EPYC + NVMe

Hızlı model yüklemeleri için NVMe, çıkarım için en güncel EPYC. GPU planlarında PCI passthrough ile adanmış GPUlar.

14 günlük para iadesi

Gerçek çıkarım gecikme testinizi Cloudzy üzerinde çalıştırın. SLO'nuza uymuyorsa 14 gün içinde iade alın.

%99,95 uptime

Üretim ortamındaki AI APIları, yoğun saatlerde yeniden başlamayan bir host gerektirir. Son 30 günün SLA verileri status.cloudzy.com adresinde herkese açık olarak takip edilmektedir.

Sohbette mühendisler

CUDA sürümleri, NCCL hataları veya vLLM ayarlarında mı takıldınız? AI iş yükü deneyimine sahip mühendisler saatler değil dakikalar içinde yanıt verir.

AI stack

Hangi framework'ü kullanırsanız kullanın.
Çalışır.

PyTorch, TensorFlow, JAX, vLLM, TGI, Ollama, llama.cpp, sglang hepsi sorunsuz çalışır. GPU planlarındaki önceden yapılandırılmış CUDA imajları sürücü kurulumu derdini ortadan kaldırır. CPU planları ise nicelenmiş çıkarım ve embedding worker'larını düşük maliyetle karşılar.

GPU planlarında Docker + nvidia-container-toolkit hazır
PyTorch
CPU & GPU
TensorFlow
CPU & GPU
vLLM
GPU LLM sunumu
Ollama
CPU + GPU LLMlar
Hugging Face
Transformers · Diffusers
pgvector
RAG vektör deposu
Qdrant
Vektör DB
LangChain
Ajan çerçevesi

Kullanım senaryoları

AI ekiplerinin çalıştığı altyapı
Cloudzy.

LLM inference APIları

Kendi OpenAI uyumlu endpoint'inizin arkasında quantize edilmiş 7B–70B sınıfı LLM modellerini sunun. GPU üzerinde vLLM veya TGI; büyük CPU'de llama.cpp / Ollama. Müşterilerinizi token başına faturalandırın.

RAG backend'leri

CPU VPS üzerinde Postgres + pgvector veya Qdrant; embedding/üretim için isteğe bağlı GPU sunucu. NVMe sayesinde vektör sorguları hızlı kalır.

Ajan runtime'ları

OpenAI/Anthropic APIlarına ve kendi verilerinize bağlanan, uzun süre çalışan LangChain veya LlamaIndex ajanları. Statik IP, araç çağrılarını kararlı tutar.

Görüntü / video üretimi

RTX sınıfı GPUlarda Stable Diffusion, SDXL, ComfyUI ve video modelleri. NVMe ile modelleri dakikalar değil, saniyeler içinde değiştirin.

İnce ayar ve eğitim

RTX sınıfında LoRA / QLoRA ince ayarı; veri merkezi sınıfı GPUlarda tam parametre eğitimi. CUDA, NCCL ve PyTorch önceden yapılandırılmış olarak gelir.

Embedding işçileri

Milyonlarca belgeyi gömmek için 16–32 GB CPU VPS üzerinde bir sentence-transformers işçisi çalıştırın. API başına ücret ödemekten kurtulun.

60s
Hazırlama
40 Gbps
Yükseliş bağlantısı
Yalnızca NVMe
Depolama
12
Bölgeler
99.95%
Çalışma Süresi SLA
14 gün
Para iadesi

Küresel ağ

12 bölge. Dört kıta.
Inference gecikmesi, çözüldü.

AI APIınızı müşterilerinize yakın konumlandırın. Bir bölgede CPU gateway, başka bir bölgede GPU sunucu kullanın.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

CPU AI planları

Quantized LLMlar · RAG · Embeddings. CPU yeterli.

Pek çok AI iş yükü CPU ile çalışır. Saatlik faturalandırma · Tüm planlarda %50 indirim · GPU planları ayrıca listelenir: /pricing.

12 GB DDR5

RAG arka ucu · vektör DB · gömme modelleri

$34.98 /ay
$69.95/mo −%50
Hemen başlat
14 günlük para iadesi
  • 4 vCPU @ EPYC
  • 300 GB NVMe
  • 8 TB · 40 Gbps
  • Ollama / vLLM CPU
  • Kök SSH · KVM
16 GB DDR5

Orta ölçekli CPU çıkarımı · API ağ geçidi

$49.98 /ay
$99.95/mo −%50
Hemen başlat
14 günlük para iadesi
  • 8 vCPU @ EPYC
  • 350 GB NVMe
  • 10 TB · 40 Gbps
  • Ollama / vLLM CPU
  • Kök SSH · KVM

SSS. AI VPS

Sık sorulan sorular, net yanıtlar.

AI VPS nedir?

AI VPS, AI iş yükleri için boyutlandırılmış ve yapılandırılmış bir Linux bulut sunucusudur. CPU çıkarımı ve RAG için yüksek RAM ve EPYC çekirdekler; eğitim ve büyük model servis için NVIDIA sınıfı GPU'ler sunar. Bağlanın, stack'inizi kurun, çalıştırın. Aynı VPS konsepti, farklı işler için farklı biçimler.

GPU'e ihtiyacım var mı, yoksa CPU yeter mi?

Modele bağlı. Quantized 7B sınıfı LLM'ler (llama.cpp veya Ollama ile int4 / int8), 16-32 GB CPU planında kullanılabilir düzeyde çalışır. Gömme modelleri, vektör veritabanları (Qdrant, Weaviate, pgvector) ve RAG pipeline'ları büyük ölçüde CPU'e bağlıdır. Eğitim, büyük model servisi veya yüksek iş hacmi gerektiren her şey için GPU planı tercih edin.

Bir yük dengeleyici arkasında çıkarım API'i çalıştırabilir miyim?

Evet. vLLM, TGI veya kendi FastAPI servisinizi bir GPU sunucusunda çalıştırın; önüne API ağ geçidi ve hız sınırlayıcı olarak küçük bir CPU VPS koyun. Her ikisi aynı bölgedeki özel ağı paylaşır. 40 Gbps bant genişliğiyle ağ geçidi hiçbir zaman darboğaz olmaz.

RAG arka ucu barındırabilir miyim?

Evet, üstelik bu en yaygın kullanım biçimlerinden biri. 16-32 GB CPU VPS, Postgres + pgvector veya Qdrant'ı düşük maliyetle çalıştırır; üretim için bir GPU VPS'ye veya barındırılan bir LLM'ye çağrı yaparsınız. NVMe vektör sorgularını hızlandırır, EPYC toplu işlemlerdeki gömme hesaplamalarını üstlenir.

Hangi AI framework'leri destekleniyor?

Hepsi. PyTorch, TensorFlow, JAX, ONNX, llama.cpp, Ollama, vLLM, TGI, sglang, MLX (uygun donanımda), Hugging Face Transformers; conda, pip veya Docker ile kurulum yapın. GPU planlarında hazır CUDA imajları, her planda tam root erişimi.

GPU'ler paylaşımlı mı?

Hayır. GPU planları PCI passthrough kullanır; rezerve ettiğiniz GPU, VM'inize özel olarak ayrılır, tam bellek ve tam saat hızıyla. CUDA, NVENC ve NCCL, bare-metal bir sunucuyla aynı şekilde davranır. Uygun maliyetli çıkarım için RTX sınıfı, üst düzey eğitim için veri merkezi sınıfı.

Ne kadar VRAM'a ihtiyacım var?

8 GB for SDXL or 7B-class LLMs at int4. 24 GB for 13B at fp16 or 70B at int4. 40+ GB for fp16 70B and full-precision training. Match the GPU plan to your model size, quantization changes the math, so test before committing to a tier.

Para iade garantisi var mı?

Satın alma tarihinden itibaren 14 gün içinde, soru sormadan tam iade. Yıllık plana geçmeden önce gerçek çıkarım gecikme testinizi ve RAG benchmark'ınızı çalıştırın, Cloudzy'nin size uyup uymadığına kendiniz karar verin.

Sağlama ne kadar sürer?

Ödeme onaylandıktan sonra AI VPS'niz 60 saniyede aktif olur. CPU veya GPU fark etmez. GPU planlarındaki hazır CUDA imajları sayesinde `nvidia-smi` saniyeler içinde yanıt verir. CPU planları Ubuntu LTS veya Debian ile gelir; AI stack'inizi conda ya da pip ile birkaç dakikada kurarsınız.

Bunu production'da kullanabilir miyim?

Evet. %99,95 çalışma süresi SLA, saatlik faturalandırma, taahhüt yok, özel IP'ler ve yeniden yapılandırma gerektirmeden RAM/vCPU/depolama alanını canlı olarak ölçeklendirme seçeneği. Müşterilerimizin pek çoğu, AI inference ve RAG APIlarını Cloudzy üzerinde production ortamında çalıştırıyor.

Hazır olduğunuzda başlayalım.
60 saniyede AI VPS.

İş yükünüze uygun yapılandırmayı seçin. Inference / RAG için CPU; eğitim için GPU. Tek panel.

Kredi kartı gerekmez · 14 günlük para iade garantisi · İstediğiniz zaman iptal edin