50% kedvezmény minden csomagra, korlátozott ideig. Kezdőár: $2.48/mo

AI VPS Hosting

AI számítási feladatok,
válassz formát.

Nagy teljesítményű RAM CPU inferenciához / RAG-hoz, vagy NVIDIA-osztályú GPU tanításhoz – mindezt ugyanabból az VPS panelből.
Független felhő, 2008 óta. $2.48/hótól · root SSH 60 másodperc alatt.

4.6 · 728 reviews on Trustpilot

CPU -ból $2.48/mo · GPU tervek a árazás · 14 napos pénzvisszafizetési garancia

~ ssh root@ai-nyc-001 csatlakozva
root@ai-nyc-001:~# curl -fsSL https://ollama.com/install.sh | sh
Ollama futtatókörnyezet telepítése... kész
root@ai-nyc-001:~# ollama run llama3.1:8b-instruct-q4
manifest letöltése · 4,7 GB átvitele NVMe-re
modell kész · CPU következtetés indul
root@ai-nyc-001:~# curl localhost:11434/api/generate -d '...'
{"response":"Szia! Miben segíthetek ma?"}
root@ai-nyc-001:~# _

AI VPS egy pillantásra

Cloudzy kétféle AI VPS tárhelyet kínál: nagy teljesítményű RAM CPU csomagokat kvantált LLM inferenciához, RAG-hoz és pipeline-okhoz, valamint NVIDIA-osztály GPU tervek modellbetanításhoz és nagy modellek kiszolgálásához. A tervek futtatása: AMD EPYC, NVMe tárolás, és 40 Gbps Uplink-ek között 12 régióA CPU kezdődik $2.48 per month; az üzembe helyezés tart 60 másodperc; CUDA képek előre telepítve érhetők el az GPU csomagokon. Az Cloudzy független szolgáltatóként működik 2008, szolgál 122 000+ fejlesztő, és értékelése 4.6 / 5 by 728+ reviewers a Trustpilot-on.

CPU indul tól
$2.48 / month
GPU típusok
RTX · Pro
Kiépítés
60 másodperc
Régiók
12 világszerte
Üzemidő SLA
99.95%
Pénzvisszafizetés
14 nap

Miért választják az AI-fejlesztők az Cloudzy-t

Egy felhő, amely szállít AI.

Négy ok, amiért AI-munkaterhelésed ide való.

AMD EPYC + NVMe

Legújabb EPYC az CPU inferenciához, NVMe a gyors modellbetöltéshez. Dedikált GPU-ek PCI passthrough-on keresztül, GPU csomagokban.

14 napos visszatérítési garancia

Futtass valódi inferencia-késleltetési tesztet az Cloudzy-n. Ha nem felel meg az SLO-dnak, 14 napon belül visszatérítünk.

99.95% üzemidő

Az éles AI APIoknak olyan hosztra van szükségük, amely csúcsterhelés közben sem indul újra. Az elmúlt 30 nap SLAát nyilvánosan követheted a status.cloudzy.com oldalon.

Mérnökök a csevegésben

Elakadtál CUDA-verziókkal, NCCL-hibákkal vagy vLLM hangolással? AI-terhelésben jártas mérnökeink perceken belül segítenek, nem órákon belül.

A mesterséges intelligencia verem

Bármilyen keretrendszerrel dolgozol, nálunk működik.
Működik.

PyTorch, TensorFlow, JAX, vLLM, TGI, Ollama, llama.cpp, sglang – mind gond nélkül fut. Az GPU csomagokhoz előre telepített CUDA image-ek tartoznak, így nincs szükség manuális driver-beállításra. Az CPU csomagok kvantált inferenciára és embedding workerekre is megfelelnek, kedvező áron.

Docker + nvidia-container-toolkit előre telepítve GPU terveken
PyTorch
CPU & GPU
TensorFlow
CPU & GPU
vLLM
GPU LLM kiszolgálás
Ollama
CPU + GPU LLM-ok
Hugging Face
Transformers · Diffusers
pgvector
RAG vektortár
Qdrant
Vektor adatbázis
LangChain
Ügynök keretrendszer

Felhasználási esetek

Amin az AI-csapatok dolgoznak
Cloudzy.

LLM inferencia API-ok

Kvantált 7B–70B méretű LLM-okat szolgálhatsz ki saját OpenAI-kompatibilis végponton. vLLM vagy TGI GPU-en, llama.cpp / Ollama nagy CPU esetén. Számlázz ügyfeleidnek tokenenként.

RAG háttérrendszerek

Postgres + pgvector vagy Qdrant egy CPU-os VPS-on, opcionálisan egy GPU gép embedding és generálás céljára. NVMe gondoskodik arról, hogy a vektoros keresések gyorsak maradjanak.

Ügynök futtatási időpontok

Hosszan futó LangChain vagy LlamaIndex ügynökök, amelyek OpenAI/Anthropic API-okat és saját adatforrásokat hívnak. A statikus IP stabilan tartja az eszközhívásokat.

Kép- és videógenerálás

Stable Diffusion, SDXL, ComfyUI, videómodellek RTX-osztályú GPU-eken. NVMe segítségével másodpercek alatt váltasz modellt.

Fine-tuning és tanítás

LoRA / QLoRA fine-tuning RTX-osztályon, teljes paraméteres tanítás adatközpont-osztályú GPU-eken. Előre telepített CUDA, NCCL, PyTorch.

Beágyazási dolgozók

Futtass egy sentence-transformers munkást 16–32 GB-os CPU-es VPS-on, és ágyazz be millió dokumentumot anélkül, hogy hívásalapú SaaS díjakat fizetnél.

60s
Kiépítés
40 Gbps
Felfelé mutató kapcsolat
Csak NVMe
Tárolás
12
Régiók
99.95%
Üzemidő SLA
14 nap
Pénzvisszafizetés

Globális hálózat

12 régió. Négy kontinens.
Inferencia-késleltetés megoldva.

Helyezd az AI API-odat közel az ügyfeleidhez. Párosíts egy CPU átjárót az egyik régióban egy GPU géppel egy másikban.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

CPU AI tervek

Kvantált LLM-ok · RAG · Embeddings. CPU elegendő.

Sok AI-munkaterhelés CPU-igényes. Óránkénti számlázás · 50% kedvezmény minden terven · GPU tervek külön listázva itt: /pricing.

12 GB DDR5

RAG backend · vektor-adatbázis · embeddings

$34.98 /hó
$69.95/mo −50%
Telepítés most
14 napos visszatérítési garancia
  • 4 vCPU @ EPYC
  • 300 GB NVMe
  • 8 TB · 40 Gbps
  • Ollama / vLLM CPU
  • Root SSH · KVM
16 GB DDR5

Közepes méretű CPU inferencia · API átjáró

$49.98 /hó
$99.95/mo −50%
Telepítés most
14 napos visszatérítési garancia
  • 8 vCPU @ EPYC
  • 350 GB NVMe
  • 10 TB · 40 Gbps
  • Ollama / vLLM CPU
  • Root SSH · KVM

GYIK. AI VPS

Gyakori kérdések egyenes válaszok.

Mi az AI VPS?

Az AI VPS egy Linux felhőszerver, amelyet AI-munkaterhelésekre méreteztek és konfiguráltak: nagy RAM és sok EPYC mag CPU-es inferenciához és RAG-hoz, illetve NVIDIA-osztályú GPU-ek tanításhoz és nagy modellek kiszolgálásához. Bejelentkezel, telepíted a stackedet, és futtatod. Ugyanaz a VPS, különböző formákban, különböző feladatokhoz.

Szükségem van GPU-re, vagy CPU is elegendő?

A modelltől függ. A kvantált 7B-os osztályú LLM-ek (int4 / int8, llama.cpp vagy Ollama segítségével) már egy 16–32 GB-os CPU csomagon is jól futnak. Az embedding modellek, a vektoros adatbázisok (Qdrant, Weaviate, pgvector) és a RAG pipeline-ok jellemzően CPU-korlátosak. Tanításhoz, nagyobb modellek kiszolgálásához vagy áteresztőképesség-igényes feladatokhoz GPU csomag kell.

Futtathatok inference API-t terheléselosztó mögött?

Igen. Futtasd a vLLM-t, a TGI-t vagy a saját FastAPI szolgáltatásodat egy GPU gépen, és helyezz elé egy kisebb CPU VPS-t API-átjáróként és sebességkorlátozóként. Mindkettő ugyanazon a privát hálózaton osztozik, azonos régióban. A 40 Gbps-os sávszélesség miatt az átjáró sosem jelent szűk keresztmetszetet.

Hosztolhatok RAG backendet?

Igen, és ez az egyik legelterjedtebb konfiguráció. Egy 16–32 GB-os CPU VPS olcsón futtatja a Postgres + pgvector vagy Qdrant kombinációt, a generáláshoz pedig egy GPU VPS-t vagy hosztolt LLM-t hívsz meg. A NVMe gyorssá teszi a vektoros lekérdezéseket, a EPYC pedig a kötegelt embedding számítást kezeli.

Mely AI keretrendszerek támogatottak?

Mindegyik. PyTorch, TensorFlow, JAX, ONNX, llama.cpp, Ollama, vLLM, TGI, sglang, MLX (megfelelő hardveren), Hugging Face Transformers – telepítsd conda, pip vagy Docker segítségével. A GPU csomagokon előre konfigurált CUDA image-ek érhetők el, minden csomaghoz teljes root hozzáférés jár.

A GPU-ek megosztottak?

Nem. A GPU csomagok PCI passthrough-t használnak: a lefoglalt GPU kizárólag a te VM-edhez tartozik, teljes memóriával és órajelekkel. A CUDA, NVENC és NCCL pontosan úgy viselkedik, mint egy bare-metal gépen. RTX-osztály a költséghatékony inferenciához, adatközponti osztály a csúcsteljesítményű tanításhoz.

Mennyi VRAM kell?

8 GB for SDXL or 7B-class LLMs at int4. 24 GB for 13B at fp16 or 70B at int4. 40+ GB for fp16 70B and full-precision training. Match the GPU plan to your model size, quantization changes the math, so test before committing to a tier.

Van pénzvisszafizetési garancia?

Igen, a vásárlástól számított 14 napon belül teljes visszatérítés, feltétel nélkül. Végezd el az éles inference késleltetési tesztet és a RAG benchmarkot, és döntsd el, megfelel-e számodra a Cloudzy, mielőtt éves előfizetésre váltasz.

Milyen gyors a kiépítés?

A fizetés jóváhagyása után az AI VPS-ed 60 másodpercen belül él. CPU és GPU esetén egyaránt. A GPU csomagokon az előre konfigurált CUDA image-eknek köszönhetően az `nvidia-smi` másodperceken belül visszatér. A CPU csomagokhoz Ubuntu LTS vagy Debian jár; az AI stack-et conda vagy pip segítségével néhány perc alatt telepítheted.

Használhatom éles környezetben?

Igen. 99,95%-os rendelkezésre állási SLA, óránkénti számlázás, kötöttségek nélkül, dedikált IP-k, és lehetőség az RAM/vCPU/tárhely élő skálázására újraépítés nélkül. Ügyfeleink jelentős része a Cloudzy-ről futtat AI inference és RAG API-eket éles környezetben.

Készen állunk, ha te is készen vagy.
AI VPS 60 másodperc alatt.

Válaszd a munkaterhedhez illő konfigurációt. CPU inferenciához / RAG-hoz; GPU tanításhoz. Ugyanaz a vezérlőpult.

Nem szükséges bankkártya · 14 napos pénzvisszafizetési garancia · Bármikor lemondható