%50 indirim tüm planlarda, sınırlı süreyle. Başlangıç fiyatı $2.48/mo

AI VPS Barındırma

Yapay zeka iş yükleri,
şeklini seç.

Çıkarım / RAG için yüksek RAM CPU veya eğitim için NVIDIA sınıfı GPU, aynı VPS paneli.
2008'den beri bağımsız bulut. 2,48 $/ay'dan başlar · 60 saniyede root SSH.

4.6 · 706 reviews on Trustpilot

CPU'dan $2.48/mo · GPU planları açık fiyatlandırma · 14 gün içinde para iadesi

~ ssh root@ai-nyc-001 bağlı
root@ai-nyc-001:~# curl -fsSL https://ollama.com/install.sh | ş
Ollama çalışma zamanı yükleniyor... tamamlandı
root@ai-nyc-001:~# ollama llama3.1:8b-instruct-q4'ü çalıştır
bildirimi çekme · 4,7 GB'ı NVMe'ye indirme
model hazır · CPU çıkarımı başlatılıyor
root@ai-nyc-001:~# curl localhost:11434/api/generate -d '...'
{"response":"Merhaba! Bugün size nasıl yardımcı olabilirim?"}
root@ai-nyc-001:~# _

Bir bakışta AI VPS

Cloudzy AI VPS barındırmayı iki şekilde sunar: yüksek RAM CPU nicelenmiş LLM çıkarımı, RAG ve ardışık düzenlerin yanı sıra planlar NVIDIA sınıfı Eğitim ve büyük model sunumuna yönelik GPU planları. Planlar devam ediyor AMD EPYC, NVMe depolama, Ve 40 Gbps uplink şurada 12 bölge. CPU başlangıç ​​tarihi ayda 2,48 $; provizyon alımları 60 saniye; CUDA görüntüleri GPU planlarında önceden hazırlanmıştır. Cloudzy o zamandan beri bağımsız olarak faaliyet gösteriyor 2008, hizmet veriyor 122.000+ geliştiricive puanı 4.6 / 5 by 706+ reviewers Trustpilot'ta.

CPU başlangıç ​​tarihi
2,48 $ / ay
GPU türleri
RTX · Profesyonel
Sağlama
60 saniye
Bölgeler
Dünya genelinde 12
Uptime SLA
99.95%
Para iadesi
14 gün

Yapay zeka geliştiricileri neden Cloudzy'i seçiyor?

Bir bulut ki AI'yi gemiler.

Yapay zeka iş yükünüzün buraya ait olmasının dört nedeni.

AMD EPYC + NVMe

CPU çıkarımı için en son EPYC, hızlı model yüklemeleri için NVMe. GPU planlarında PCI geçişi aracılığıyla özel GPU'lar.

14 gün para iade garantisi

Gerçek çıkarım gecikme testinizi Cloudzy'de çalıştırın. SLO'nuza uymuyorsa 14 gün içinde paranızı iade edin.

%99,95 kesintisiz çalışma

Üretim AI API'leri yoğun saatlerde yeniden başlatılmayan bir ana bilgisayara ihtiyaç duyar. Son 30 günlük SLA, status.cloudzy.com adresinde herkese açık olarak izlenir.

Sohbette mühendisler

CUDA sürümlerinde, NCCL hatalarında veya vLLM ayarlarında mı takıldınız? Yapay zeka iş yükü deneyimine sahip mühendisler, saatler değil dakikalar alır.

Yapay zeka yığını

Hangi çerçeve olursa olsun getirin.
Çalışıyor.

PyTorch, TensorFlow, JAX, vLLM, TGI, Ollama, llama.cpp, sglang, hepsi temiz çalışıyor. Önceden pişirilmiş GPU planlarındaki CUDA görüntüleri sürücü dansını atlıyor. CPU planları nicelleştirilmiş çıkarımı yönetir ve İşçileri ucuza yerleştirme.

Docker + nvidia-container-toolkit, GPU planlarına hazır
PyTorch
CPU ve GPU
TensorFlow
CPU ve GPU
vLLM
GPU Yüksek Lisans sunumu
Ollama
CPU + GPU Yüksek Lisans Dereceleri
Sarılma Yüz
Transformatörler · Difüzörler
pgvektör
RAG vektör deposu
Qdrant
vektör veri tabanı
LangChain
Aracı çerçevesi

Kullanım alanları

Yapay zeka ekipleri ne üzerinde çalışıyor?
Cloudzy.

LLM çıkarım API'leri

Kendi OpenAI uyumlu uç noktanızın arkasında nicelenmiş 7B–70B sınıfı LLM'ler sunun. GPU'da vLLM veya TGI, büyük CPU'da llama.cpp / Ollama. Müşterilerinizi jetonla faturalandırın.

RAG arka uçları

CPU VPS'de Postgres + pgvector veya Qdrant, yerleştirme/oluşturma için isteğe bağlı GPU kutusu. NVMe, vektör aramalarının hızlı kalması anlamına gelir.

Aracı çalışma süreleri

OpenAI/Antropik API'lere ve kendi verilerinize saldıran uzun süredir çalışan LangChain veya LlamaIndex aracıları. Statik IP, araç çağrısını istikrarlı tutar.

Görüntü / video oluşturma

Stabil Difüzyon, SDXL, ComfyUI, RTX sınıfı GPU'larda video modelleri. NVMe, modelleri dakikalar değil saniyeler içinde değiştirmenize olanak tanır.

İnce ayar ve eğitim

LoRA / QLoRA, veri merkezi sınıfı GPU'larda RTX sınıfı, tam parametreli eğitime ince ayarlar yapar. Önceden pişirilmiş CUDA, NCCL, PyTorch.

İşçileri yerleştirme

Arama başına SaaS ücretleri ödemeden milyonlarca belgeyi yerleştirmek için 16-32 GB CPU VPS'de bir cümle dönüştürücü çalışanı çalıştırın.

60s
Sağlama
40 Gbps
Yukarı bağlantı
Yalnızca NVMe
Depolamak
12
Bölgeler
99.95%
Uptime SLA
14 gün
Para iadesi

Küresel ağ

12 bölge. Dört kıta.
Çıkarım gecikmesi çözüldü.

AI API'nizi müşterilerinizin yakınına yerleştirin. Bir bölgedeki CPU ağ geçidini diğer bölgedeki GPU kutusuyla eşleştirin.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

CPU yapay zeka planları

Nicelenmiş LLM'ler · RAG · Yerleştirmeler. CPU'muz yeterli.

Birçok AI iş yükü CPU'ya bağlıdır. Saatlik faturalandırma · Tüm planlarda %50 indirim · GPU planları ayrı olarak listelenmiştir /fiyatlandırma.

12 GB DDR5

RAG arka uç · vektör DB · yerleştirmeler

$34.98 /ay
$69.95/mo −50%
Şimdi dağıt
14 gün para iade garantisi
  • 4 vCPU @ EPYC
  • 300 GB NVMe
  • 8 TB · 40 Gbps
  • Ollama / vLLM CPU
  • Root SSH · KVM
16 GB DDR5

Orta boyutlu CPU çıkarımı · API ağ geçidi

$49.98 /ay
$99.95/mo −50%
Şimdi dağıt
14 gün para iade garantisi
  • 8 vCPU @ EPYC
  • 350 GB NVMe
  • 10 TB · 40 Gbps
  • Ollama / vLLM CPU
  • Root SSH · KVM

SSS. Yapay Zeka VPS'si

Sık sorulan sorular, net cevaplar.

AI VPS nedir?

AI VPS, AI iş yükleri, CPU çıkarımı ve RAG için yüksek RAM ve EPYC çekirdekleri veya eğitim ve büyük model sunumu için NVIDIA sınıfı GPU'ler için boyutlandırılmış ve yapılandırılmış bir Linux bulut sunucusudur. SSH'yi girin, yığınınızı kurun ve çalıştırın. Aynı VPS, farklı işler için farklı şekiller.

GPU'ya ihtiyacım var mı yoksa CPU çalışacak mı?

Modele bağlıdır. Nicelenmiş 7B sınıfı LLM'ler (llama.cpp veya Ollama aracılığıyla int4 / int8), 16–32 GB CPU planında kullanışlı bir şekilde çalışır. Gömme modelleri, vektör veritabanları (Qdrant, Weaviate, pgvector) ve RAG işlem hatları çoğunlukla CPU'ya bağlıdır. Eğitim, daha büyük model sunumu veya işlem hacmi yoğun olan herhangi bir şey için bir GPU planına ihtiyacınız var.

Bir yük dengeleyicinin arkasında çıkarım API çalıştırabilir miyim?

Evet. Bir GPU kutusunda vLLM, TGI veya kendi FastAPI hizmetinizi çalıştırın, API ağ geçidi ve hız sınırlayıcı olarak önüne küçük bir CPU VPS yerleştirin. Her ikisi de aynı bölgede özel bir ağı paylaşıyor. 40 Gbps, ağ geçidinin asla darboğaz olmayacağı anlamına gelir.

Bir RAG arka ucunu barındırabilir miyim?

Evet ve en yaygın şekillerden biri. 16–32 GB CPU VPS, Postgres + pgvector veya Qdrant'ı ucuz bir şekilde çalıştırır; nesil için bir GPU VPS'ye veya barındırılan LLM'ye çağrı yaparsınız. NVMe, vektör sorgularını hızlı hale getirir, EPYC ise toplu işlem yaptığınızda yerleştirme işlemini gerçekleştirir.

Hangi AI çerçeveleri desteklenir?

Hepsi. PyTorch, TensorFlow, JAX, ONNX, llama.cpp, Ollama, vLLM, TGI, sglang, MLX (uygun donanımda), Hugging Face Transformers, conda, pip veya Docker aracılığıyla kurulum. GPU planlarında önceden hazırlanmış CUDA görüntüleri, her planda tam kök.

GPU'lar paylaşılıyor mu?

Hayır. GPU planları PCI geçişini kullanır; ayırdığınız GPU, VM'nize, tam belleğe ve tam saatlere ayrılmıştır. CUDA, NVENC ve NCCL'nin tümü çıplak metal kutudakiyle aynı şekilde davranır. Uygun maliyetli çıkarım için RTX sınıfı, üst düzey eğitim için veri merkezi sınıfı.

Ne kadar VRAM'e ihtiyacım var?

8 GB for SDXL or 7B-class LLMs at int4. 24 GB for 13B at fp16 or 70B at int4. 40+ GB for fp16 70B and full-precision training. Match the GPU plan to your model size, quantization changes the math, so test before committing to a tier.

Para iade garantisi var mı?

Evet, satın alma tarihinden itibaren 14 gün içinde, tam para iadesi, soru sorulmadan. Gerçek çıkarım gecikme testinizi, gerçek RAG kıyaslamanızı çalıştırın ve bir yıl taahhütte bulunmadan önce Cloudzy'nin uygun olup olmadığına karar verin.

Hazırlama ne kadar hızlı?

Ödeme onaylandıktan sonra AI VPS'niz 60 saniye içinde yayında olur. CPU veya GPU. GPU planlarındaki önceden hazırlanmış CUDA görüntüleri, "nvidia-smi"nin saniyeler içinde geri döneceği anlamına gelir. CPU planları Ubuntu LTS veya Debian ile birlikte gönderilir; AI yığınınızı conda veya pip aracılığıyla birkaç dakika içinde yükleyin.

Bunu üretimde kullanabilir miyim?

Evet. %99,95 kesintisiz çalışma SLA'sı, saatlik faturalandırma, taahhüt yok, özel IP'ler ve yeniden oluşturma gerekmeden RAM/vCPU/depolamayı canlı olarak ölçeklendirme seçeneği. Müşterilerimizin çoğu, üretimde Cloudzy'den yapay zeka çıkarımı ve RAG API'leri çalıştırıyor.

Sen hazır olduğunda biz hazırız.
60 saniyede AI VPS.

İş yükünüzün ihtiyaç duyduğu şekli seçin. Çıkarım için CPU / RAG; Eğitim için GPU. Aynı panel.

Kredi kartı gerekmez · 14 gün para iade garantisi · İstediğin an iptal et