Ugrás a fő tartalomra
50% kedvezmény minden csomagra, korlátozott ideig. Már $2.48/mo

ChatGPT VPS Hosting

Saját AI szervered,
a saját szabályaid szerint.

Self-host open-weight LLMs and AI APIs on AMD EPYC with NVMe storage.
Independent cloud since 2008, no vendor lock-in, no usage caps.
Trusted by 122,000+ users · from $2.48/mo.

4.7 · 755 reviews on Trustpilot

Kezdő ár $2.48/mo · 50% kedvezmény · Bankkártya nélkül

~ ssh root@ai-001 csatlakozva
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Installing Ollama...
Ollama installed successfully.
root@ai-001:~# ollama pull llama3
pulling model llama3... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS egy pillantásra

Cloudzy offers ChatGPT VPS hosting for self-hosting LLMs and AI inference across 13 regions, starting at $2.48/mo. Every plan runs on AMD EPYC with DDR5 memory, NVMe storage, and 40 Gbps uplinks. Install Ollama, llama.cpp, vLLM, or your own inference stack, full root access, no API rate limits. Provision in 60 seconds. Independent since 2008, rated 4.7/5 by 700+ reviewers on Trustpilot.

Kezdő ár
2,48 $ / hó
CPU
AMD EPYC · DDR5
Kiépítés
60 másodperc
Régiók
13 világszerte
Pénzvisszafizetés
14 nap
Alapított
2008

Miért választják a fejlesztők a Cloudzy-t

Egy technológiához értő kedvenc

Az a négy dolog, amelyben a vásárlók valóban összehasonlítanak minket, jól megcsinálva.

Csúcsspecifikációjú infrastruktúra

Legújabb generációs AMD EPYC, kizárólag NVMe tárhely, DDR5 memória, 40 Gbps feltöltés. Single-thread vezető szerep minden csomagszinten.

Kockázatmentes próba

14 napos pénzvisszafizetési garancia minden csomagra. Kérdések nélkül. Nincs beállítási díj. Bármikor lemondhatja az irányítópultról.

99,95% uptime SLA

Automatizált monitorozás 13 régióban. Az elmúlt 30 napos SLA-t nyilvánosan követjük a status.cloudzy.com oldalon, nincs takargatás.

24/7 emberi támogatás

Élő chat és ticket válaszok jellemzően 5 percen belül. Mérnökök, nem szkriptolvasók. Medián megoldás 1 órán belül.

Önállóan futtatható AI-eszközök

Open-weight models, your infrastructure.

Futtass bármilyen nyílt súlyozású modellt vagy AI-keretrendszert. Teljes root-hozzáféréssel te választod meg a stacket, a modellt és a kiszolgálási réteget. Nincs szükség harmadik féltől származó API-kulcsokra.

Ollama
Egyetlen paranccsal induló LLM-kiszolgálás
llama.cpp
CPU-optimalizált következtetés
vLLM
Nagy áteresztőképességű kiszolgálás
Open WebUI
Chat-felület LLM-ekhez
LangChain
Orkesztráció keretrendszer
Hugging Face
Modellközpont + Transformers

Felhasználási esetek

Miért választják a fejlesztők
Cloudzy ChatGPT VPS-ja.

Privát ChatGPT-alternatíva

Futtasd a Llama 3-at, a Mistral-t vagy a Phi-t a saját szerveredén az Open WebUI segítségével. Chat-felület, előzmények, az adatok nem hagyják el a VPS-t.

API-backend az alkalmazásodhoz

Tedd elérhetővé az LLM-t a saját REST API-ed mögött. Nincs tokenalapú számlázás, nincs sebességkorlát. Integráld a SaaS-oddal, bottal vagy belső eszközzel.

Finomhangolás és kísérletek

Tölts fel adatkészleteket, hangolj finomra LoRA-adaptereket, futtass kiértékeléseket. A tartós NVMe-tárolónak köszönhetően az ellenőrzőpontjaid újraindítás után is megmaradnak.

RAG-pipeline szerver

Kombináld a helyi LLM-t egy vektoros adatbázissal (Chroma, Qdrant, Weaviate) a visszakereséssel augmentált generáláshoz. Minden egyetlen gépen.

Többmodelles összehasonlítás

Futtasd egyszerre a Llama-t, a Mistral-t és a Phi-t. Hasonlítsd össze a kimeneteket, a késleltetést és a minőséget, mielőtt élesbe vinnél egy modellt.

AI kódolási asszisztens

Hosztold saját magad a Code Llama-t vagy a DeepSeek Coder-t, és kösd össze az IDE-ddel egy helyi API-on keresztül. Automatikus kiegészítés és chat – kód nem kerül ki külső szerverre.

60s
Kiépítés
40 Gbps
Felfelé mutató kapcsolat
Csak NVMe
Tárolás
13
Régiók
99.95%
Uptime SLA
14 days
Pénzvisszafizetés

Globális hálózat

13 régió. Négy kontinens.
Egy kattintásra.

Telepítsd a ChatGPT VPS-t a lehető legközelebb a felhasználóidhoz. P50 medián késleltetés 10 ms alatt Észak-Amerikában és Európában.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Árazás

Csak a felhasznált erőforrásokért fizet. Ennyi.

Óránként, havonta vagy évente. Nincs egress díj. Nincs elköteleződés. Jelenleg 50% kedvezmény minden csomag.

512 MB DDR5

Kis modellek · tesztelés

$2.48 /mo
$4.95/mo −50%
Telepítés most
14 napos pénzvisszafizetés
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Dedikált IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

Kis LLM-ek · 7B paraméter

$7.475 /mo
$14.95/mo −50%
Telepítés most
14 napos pénzvisszafizetés
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedikált IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

13B+ modellek · RAG stack-ek

$26.475 /mo
$52.95/mo −50%
Telepítés most
14 napos pénzvisszafizetés
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Dedikált IPv4 + IPv6
  • Root SSH · KVM

Gyakran Ismételt Kérdések — ChatGPT VPS

Gyakori kérdések, egyenes válaszok.

Futtathatom a ChatGPT-t saját VPS-en?

Maga a ChatGPT az OpenAI saját zárt szolgáltatása, de nyílt súlyú alternatívákat – például Llama 3-at, Mistral-t, Phi-t vagy DeepSeek-et – saját Cloudzy VPS-en is futtathatsz. Az Ollama és az Open WebUI hasonló chat-élményt nyújt, teljes adatvédelemmel.

Mennyi RAM kell LLM inferenciához?

A modell méretétől függ. Egy 7B paraméteres modell (például a kvantált Llama 3 8B) 4–8 GB RAM-el fut. Egy 13B-es modellhez 8–16 GB kell. A nagyobb, 70B-es modellekhez 32–64 GB szükséges. Kis modellekhez kezdj a 4 GB-os csomaggal, és bővítsd igény szerint.

Szükséges GPU a LLM-ek futtatásához?

Nem. Az olyan eszközök, mint a llama.cpp és az Ollama, AMD EPYC-on futó CPU-alapú inferenciára is optimalizáltak. A tokens/másodperc sebesség alacsonyabb, mint GPU esetén, de személyes használatra, kis csapatoknak vagy aszinkron batch feladatokhoz a CPU-alapú inferencia tökéletesen megfelel – és töredékébe kerül a GPU-alapú hosztingnak.

Futtathatok egyszerre több modellt?

Igen. Elegendő RAM mellett több modellt is futtathatasz az Ollama-en vagy a vLLM-en keresztül, és igény szerint válthatsz köztük. Minden modell igény esetén töltődik be a memóriába. Egy 16 GB-os csomag kényelmesen kiszolgál 2–3 kis modellt párhuzamosan.

Mi a helyzet az adatvédelemmel?

Minden az VPS-eden marad. Semmilyen adat nem kerül harmadik feles API-ekre. Te irányítod a modellt, az adatokat és a hálózatot. Ez a fő előny a felhőalapú AI-szolgáltatásokhoz képest: a promptjaid és a válaszok sosem hagyják el a szerveredet.

Hogyan telepítsem az Ollama-t?

Egyetlen parancs: curl -fsSL https://ollama.ai/install.sh | sh. Ezután tölts le egy modellt az ollama pull llama3 paranccsal, és máris chatelj. Az egész folyamat friss VPS-en 5 percen belül elvégezhető.

Elérhetővé tehetem a LLM-emet API-ként?

Igen. Az Ollama alapértelmezés szerint OpenAI-kompatibilis API-t szolgál ki a 11434-es porton. A vLLM szintén OpenAI-kompatibilis végpontot tesz elérhetővé. Irányítsd az alkalmazásodat, botodat vagy a frontendedet az VPS-ed IP-címére és portjára.

Milyen rendelkezésre állást garantálnak?

Az Cloudzy 99,95%-os rendelkezésre állási SLA-t vállal minden csomagra. Az AI-szervered éjjel-nappal online marad, redundáns hálózati útvonalakkal és 40 Gbps sávszélességgel.

Finomhangolhatok modelleket ezen az VPS-n?

Az CPU finomhangolása lehetséges, de lassú. Kis modellek (7B) LoRA/QLoRA finomhangolásához egy magas RAM-s CPU csomag kísérletezésre megfelel. Nagy modellek éles finomhangolásához az GPU példányok praktikusabbak.

Mi a pénzvisszafizetési szabályzat?

14 napos pénzvisszafizetési garancia, feltétel nélkül. Teszteld az AI konfigurációdat, mérd meg az inferencia sebességét, majd döntsd el. Teljes visszatérítés az irányítópultról vagy a supporton keresztül.

Készen állunk, amikor Ön is.
AI szerver 60 másodperc alatt.

Nincs szükség hitelkártyára · 14 napos pénzvisszafizetési garancia · Bármikor lemondható