50% kedvezmény minden csomagra, korlátozott ideig. Már $2.48/mo

AI VPS hosting

AI munkaterhelések,
válaszd ki az alakod.

Nagy RAM-mal rendelkező CPU következtetésekhez / RAG, vagy NVIDIA-osztályú GPU képzéshez, ugyanaz a VPS panel.
Független felhő 2008 óta. 2,48 $/hó-tól · root SSH 60 másodperc alatt.

4.6 · 706 reviews on Trustpilot

CPU innen $2.48/mo · GPU-tervek bekapcsolva árképzés · 14 napos pénzvisszatérítés

~ ssh root@ai-nyc-001 csatlakoztatva
root@ai-nyc-001:~# curl -fsSL https://ollama.com/install.sh | sh
Az Ollama futtatókörnyezet telepítése... kész
root@ai-nyc-001:~# ollama futtassa a llama3.1:8b-instruct-q4
jegyzék letöltése · 4,7 GB letöltése az NVMe-be
modell kész · CPU következtetés indítása
root@ai-nyc-001:~# curl localhost:11434/api/generate -d '...'
{"response":"Szia! Hogyan segíthetek ma?"}
root@ai-nyc-001:~# _

AI VPS egy pillantásra

Cloudzy AI VPS-tárhelyet kínál kétféle formában, nagy RAM-mal CPU tervek a kvantált LLM következtetésekhez, RAG-hoz és csővezetékekhez, valamint NVIDIA osztályú GPU-csomagok tanításhoz és nagy modellek kiszolgálásához. A csomagok futnak AMD EPYC, NVMe tárhely, és 40 Gbps feltöltés 12 régió. A CPU ekkor indul 2,48 $/hónap; az ellátás igénybevétele 60 másodperc; A CUDA-képek a GPU-terveken vannak előre elkészítve. A Cloudzy azóta önállóan működik 2008, kiszolgálja 122 000+ fejlesztő, és értékelése 4.6 / 5 by 706+ reviewers a Trustpiloton.

A CPU ekkor indul
2,48 $ / hó
GPU típusok
RTX · Pro
Ellátás
60 másodperc
Régiók
12 világszerte
Uptime SLA
99.95%
Pénzvisszafizetés
14 nap

Miért választják az AI-fejlesztők a Cloudzy-t?

Egy felhő, ami hajók AI.

Négy ok, amiért az AI-terhelés ide tartozik.

AMD EPYC + NVMe

A legújabb EPYC a CPU következtetésekhez, NVMe a gyors modellbetöltésekhez. Dedikált GPU-k PCI-átvitelen keresztül a GPU-terveken.

14 napos pénzvisszafizetés

Futtassa le a valós következtetési késleltetési tesztet a Cloudzy-n. Ha nem illik az Ön SLO-jához, 14 napon belül térítse vissza a visszatérítést.

99,95%-os üzemidő

Az éles AI API-knak olyan gazdagépre van szükségük, amely nem indul újra csúcsidőben. Az utolsó 30 napos SLA nyilvánosan követve a status.cloudzy.com oldalon.

Mérnökök a chaten

Elakadt a CUDA verziókban, NCCL hibákban vagy vLLM tuningban? Mérnökök AI munkaterheléssel, percekkel, nem órákkal.

Az AI verem

Hozz bármilyen keretet.
Ez fut.

PyTorch, TensorFlow, JAX, vLLM, TGI, Ollama, llama.cpp, sglang, mindegyik tisztán fut. Elősütött A CUDA-képek az GPU terveken kihagyják a sofőr táncát. Az CPU tervek kezelik a kvantált következtetéseket és dolgozók beágyazása olcsón.

Docker + nvidia-container-toolkit készen áll a GPU-tervekre
PyTorch
CPU és GPU
TensorFlow
CPU és GPU
vLLM
GPU LLM kiszolgálás
Ollama
CPU + GPU LLM-ek
Átölelő Arc
Transformers · Diffusers
pgvector
RAG vektor bolt
Qdrant
Vector DB
LangChain
Ügynök keretrendszer

Felhasználási esetek

Amiben az AI-csapatok futnak
Cloudzy.

LLM következtetés API-k

Kvantizált 7B–70B osztályú LLM-eket szolgáltasson saját OpenAI-kompatibilis végpontja mögött. vLLM vagy TGI GPU-n, llama.cpp / Ollama nagy CPU-n. Számlázzon ügyfeleinek tokennel.

RAG háttérrendszerek

Postgres + pgvector vagy Qdrant CPU VPS-en, opcionális GPU doboz a beágyazáshoz/generáláshoz. Az NVMe azt jelenti, hogy a vektoros keresések gyorsak maradnak.

Ügynök futási idők

Régóta működő LangChain vagy LlamaIndex ügynökök, amelyek elérik az OpenAI/Anthropic API-kat és az Ön saját adatait. A statikus IP stabilan tartja a szerszámhívást.

Kép/videó generálása

Stabil diffúziós, SDXL, ComfyUI, videó modellek RTX-osztályú GPU-kon. Az NVMe lehetővé teszi a modellek cseréjét másodpercek, nem pedig percek alatt.

Finomhangolás és tanítás

A LoRA / QLoRA finomhangol az RTX-osztályú, teljes paraméterű oktatás adatközpont-osztályú GPU-kon. Elősütött CUDA, NCCL, PyTorch.

Dolgozók beágyazása

Futtasson egy mondat-transzformátort egy 16–32 GB-os CPU VPS-en, hogy több millió dokumentumot ágyazzon be hívásonkénti SaaS-díjak fizetése nélkül.

60s
Ellátás
40 Gbps
Uplink
Csak NVMe
Tárolás
12
Régiók
99.95%
Uptime SLA
14 nap
Pénzvisszafizetés

Globális hálózat

12 régió. Négy kontinens.
Következtetési késleltetés, megoldva.

Helyezze AI API-ját ügyfelei közelébe. Párosítson egy CPU-átjárót az egyik régióban egy másik GPU-dobozhoz.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

CPU AI tervek

Kvantizált LLM-ek · RAG · Beágyazások. CPU elég.

Sok AI munkaterhelés CPU-hoz kötött. Óránkénti számlázás · 50% kedvezmény minden csomagra · GPU-csomagok külön listázva /árazás.

12 GB DDR5

RAG háttér · vektoros DB · beágyazások

$34.98 /mo
$69.95/mo −50%
Telepítés most
14 napos pénzvisszafizetés
  • 4 vCPU @ EPYC
  • 300 GB NVMe
  • 8 TB · 40 Gbps
  • Ollama / vLLM CPU
  • Root SSH · KVM
16 GB DDR5

Közepes méretű CPU következtetés · API átjáró

$49.98 /mo
$99.95/mo −50%
Telepítés most
14 napos pénzvisszafizetés
  • 8 vCPU @ EPYC
  • 350 GB NVMe
  • 10 TB · 40 Gbps
  • Ollama / vLLM CPU
  • Root SSH · KVM

GYIK. AI VPS

Gyakori kérdések, egyenes válaszok.

Mi az AI VPS?

Az AI VPS egy Linux felhőszerver méretű és konfigurált mesterséges intelligencia munkaterheléshez, nagy RAM-mal és EPYC magokkal az CPU következtetésekhez és RAG-hoz, vagy NVIDIA-osztályú GPU-ekhez a képzéshez és a nagymodell kiszolgáláshoz. Bekapcsolod az SSH-t, telepíted a veremet és futsz. Ugyanaz a VPS, különböző formák különböző munkákhoz.

GPU-ra van szükségem, vagy működni fog a CPU?

Modelltől függ. A kvantált 7B-osztályú LLM-ek (int4 / int8 a llama.cpp-n vagy az Ollamán keresztül) hasznosan futnak 16–32 GB-os CPU-tervben. A beágyazott modellek, vektoros adatbázisok (Qdrant, Weaviate, pgvector) és RAG-folyamatok többnyire CPU-hoz kötöttek. Oktatáshoz, nagyobb modellkiszolgáláshoz vagy bármihez, ami nagy átviteli sebességet igényel, GPU-tervet szeretne.

Futtathatok egy következtetési API-t a terheléselosztó mögött?

Igen. Futtasson vLLM-et, TGI-t vagy saját FastAPI-szolgáltatását egy GPU-dobozon, és tegyen egy kis CPU VPS-t elé API-átjáróként és sebességkorlátozóként. Mindkettő magánhálózaton osztozik ugyanabban a régióban. A 40 Gbps azt jelenti, hogy soha nem az átjáró jelenti a szűk keresztmetszetet.

Hozhatok egy RAG háttérrendszert?

Igen, és ez az egyik leggyakoribb forma. A 16–32 GB-os CPU VPS olcsón futtatja az Postgres + pgvectort vagy a Qdrant-ot, felhívhat egy GPU VPS-t vagy a hosztolt LLM-et a generációhoz. Az NVMe a vektoros lekérdezéseket pofonegyszerűvé teszi, az EPYC pedig kezeli a beágyazás számítását kötegeléskor.

Mely AI-keretrendszerek támogatottak?

Mindegyiket. PyTorch, TensorFlow, JAX, ONNX, llama.cpp, Ollama, vLLM, TGI, sglang, MLX (a megfelelő hardveren), Hugging Face Transformers, telepítés conda, pip vagy Docker segítségével. Elősütött CUDA képek az GPU terveken, teljes gyökér minden csomagon.

Megosztottak a GPU-k?

Nem. Az GPU csomagok PCI áthárítást használnak, az Ön által lefoglalt GPU a virtuális géphez, a teljes memóriához és a teljes órajelekhez van dedikálva. A CUDA, NVENC, NCCL ugyanúgy viselkedik, mint egy csupasz fém dobozon. RTX-osztály a költséghatékony következtetésekhez, adatközpont-osztály a csúcskategóriás képzéshez.

Mennyi VRAM-ra van szükségem?

8 GB for SDXL or 7B-class LLMs at int4. 24 GB for 13B at fp16 or 70B at int4. 40+ GB for fp16 70B and full-precision training. Match the GPU plan to your model size, quantization changes the math, so test before committing to a tier.

Van pénzvisszafizetési garancia?

Igen, 14 nap a vásárlástól, teljes visszatérítés, nincs kérdés. Futtassa le a valós következtetési késleltetési tesztet, a valódi RAG-benchmarkot, és döntse el, hogy az Cloudzy megfelelő-e, mielőtt elkötelezi magát egy évre.

Milyen gyors a kiépítés?

A fizetés megerősítése után AI VPS-je 60 másodpercen belül életbe lép. CPU vagy GPU. Az GPU csomagon elősütött CUDA-képek azt jelentik, hogy az "nvidia-smi" másodperceken belül visszatér. Az CPU terveket Ubuntu LTS vagy Debian csomaggal szállítjuk, néhány percen belül telepítse az AI-vermet conda vagy pip segítségével.

Használhatom ezt a termelésben?

Igen. 99,95%-os rendelkezésre állási SLA, óránkénti számlázás, kötelezettségvállalások nélkül, dedikált IP-címek és a RAM/vCPU/tárhely éles méretezésének lehetősége újraépítés nélkül. Sok ügyfelünk mesterséges intelligencia-következtetési és RAG API-kat futtat a Cloudzy éles verziójában.

Készen állunk, amikor Ön is.
AI VPS 60 másodperc alatt.

Válassza ki a munkaterheléséhez szükséges formát. CPU következtetéshez / RAG; GPU edzéshez. Ugyanaz a panel.

Nincs szükség hitelkártyára · 14 napos pénzvisszafizetési garancia · Bármikor lemondható