Yüksek Lisans çıkarımı
Llama 3, Mistral, DeepSeek veya Qwen'i vLLM veya Metin Oluşturma Çıkarımı ile servis edin. RTX 4090 4 bitte 70B'yi, RTX 5090 8 bitte 70B'yi, A100 ise nicelenmemiş işlemleri yönetir.
Cloudzy'yi kendi dilinizde görmek için bir ülke seçin.
GPU VPS Barındırma
Tam GPU geçişi. RTX 6000 Pro, A100, RTX 5090, RTX 4090. Önceden yüklenmiş CUDA, cuDNN, PyTorch hazır.
NVMe + 40 Gbps ağ bağlantısı. 2008'den beri bağımsız bulut.
Başlangıç fiyatı $506.35/mo · Yıllık %35 indirim · Kredi kartına gerek yok
Bir bakışta GPU VPS
Cloudzy GPU VPS planlarını özel olarak satıyor RTX 6000 Pro, Nvidia A100, RTX 5090, Ve RTX 4090 kartlar 1× ila 4× başlayan konfigürasyonlar $506.35 per month. Her plan en son sürüm önceden yüklenmiş olarak gönderilir CUDAcuDNN, ve Nvidia sürücüleri, AMD EPYC + DDR5 üzerinde çalışır Yalnızca NVMe depolama ve 40 Gbps yukarı bağlantılar ve hükümler 60 saniye. GPU'ler vGPU değil, özel geçiştir. MIG değil, paylaşılmıyor. Cloudzy o zamandan beri bağımsız olarak çalışmaktadır. 2008 ve puanı 4.6 / 5 by 713+ reviewers Trustpilot'ta.
Makine öğrenimi ekipleri neden Cloudzy'i seçiyor?
Ekiplerin AWS / GCP / hiper ölçekleyici GPU'lardan Cloudzy'ye geçmesinin dört nedeni.
Fiziksel kartın tamamı size ait; vGPU dilimleme yok, MIG bölümleri yok, diğer kiracılarla çekişme yok. CUDA çekirdekleri, VRAM, PCIe hatları, hepsi ayrılmış.
En son Nvidia sürücüleri, CUDA araç seti ve cuDNN, Ubuntu görüntüsüne önceden eklenmiştir. PyTorch, TensorFlow, JAX, Hugging Face, pip kurulumu ve eğitim alıyorsunuz.
Saf NVMe depolama sayesinde veri kümesi yüklemesi darboğaz oluşturmaz. 40 Gbps ağ bağlantısı, 100 GB Hugging Face modelinin çekilmesinin dakikalar değil, saniyeler içinde tamamlanacağı anlamına gelir.
Sohbette gerçek mühendisler. Yeterli sayıda ekibin çoklu GPU eğitimi oluşturmasına, CUDA OOM'larında hata ayıklamasına ve yanıtların hızlı bir şekilde geri gelmesini sağlayacak şekilde Llama çıkarımını ayarlamasına yardımcı olduk.
GPU dizisi
48 GB ECC VRAM ile profesyonel düzeyde çıkarım ve işleme için RTX 6000 Pro. Eğitim ve büyük VRAM iş yükleri için A100. En yeni çıkarım için RTX 5090. 70B'ye (4 bit) kadar uygun maliyetli çıkarım için RTX 4090. Çoklu GPU planları mevcuttur; VRAM bütçenizin neye ihtiyacı olduğunu seçin.
Kullanım alanları
Llama 3, Mistral, DeepSeek veya Qwen'i vLLM veya Metin Oluşturma Çıkarımı ile servis edin. RTX 4090 4 bitte 70B'yi, RTX 5090 8 bitte 70B'yi, A100 ise nicelenmemiş işlemleri yönetir.
ComfyUI veya Otomatik1111 ile SDXL, Flux veya ince ayarlı Stabil Difüzyon kontrol noktalarını çalıştırın. RTX 4090, standart 1024×1024 SDXL'de dakikada 30'dan fazla görüntüye ulaşıyor.
LoRA, QLoRA, tam ince ayar. A100, 7B-13B'nin nicelenmemiş ince ayarının en uygun noktasıdır; 4× A100, uygun parçalamayla (FSDP / DeepSpeed) 70B'ye kadar işleyebilir.
RTX kartlarındaki Cycles + OptiX, animasyon stüdyoları için en hızlı yoldur. RTX 4090'daki 24 GB VRAM, tek kare prodüksiyon sahnelerinin büyük çoğunluğunu kapsar.
Büyük Fısıltı, Daha Hızlı Fısıltı, YOLO, Her Şeyi Segmentlere Ayırın. RTX 4090 planı bile bu modellerde rahat bir boşluk payı ile gerçek zamanlı çıkarımlar gerçekleştirir.
Gömme oluşturma, alma işlem hatları, veri kümesi ön işleme. Saatlik ödeme yapın, işi çalıştırın, çıktının anlık görüntüsünü alın, kutuyu yok edin; bu, aynı iş yükü için AWS/GCP kiralamaktan daha ucuzdur.
Fiyatlandırma
Yıllık faturalandırma şu anda %35 indirim her GPU planında.
SSS. GPU VPS
Bir kart seçin, bir bölge seçin ve tıklayın. CUDA zaten kurulu.
Kredi kartı gerekmez · 14 gün para iade garantisi · İstediğin an iptal et