50% kedvezmény minden csomagra, korlátozott ideig. Kezdőár: $2.48/mo

ChatGPT VPS Hosting

Saját AI szervered,
a saját szabályaid szerint.

Nyílt súlyú LLMs és AI APIs saját szerveren futtatása AMD EPYC vele NVMe tárolás.
Független felhőszolgáltató 2008, nincs vendor lock-in, nincs használati korlát.
Megbíznak benne 122,000+ felhasználók · ettől $2.48/mo.

4.6 · 721 reviews on Trustpilot

Kezdve $2.48/mo · 50% kedvezmény · Bankkártya nem szükséges

~ ssh root@ai-001 csatlakozva
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Ollama telepítése...
Ollama sikeresen telepítve.
root@ai-001:~# ollama pull llama3
modell letöltése llama3... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS egy pillantásra

Cloudzy nyújt ChatGPT VPS tárhely LLM-ek önálló futtatásához és AI-következtetéshez 12 régió, kezdve $2.48/mo. Minden csomag AMD EPYC vele DDR5 memória, NVMe tárhelyét, és 40 Gbps uplink-ek. Telepítsd a Ollama-t, a llama.cpp-t, a vLLM-t, vagy a saját inference-stackedet, teljes root-hozzáféréssel, API-sebességkorlát nélkül. Üzembe helyezés 60 másodpercFüggetlen a(z) óta 2008, értékelve 4.6/5 by 679+ értékelő a Trustpilot-on.

Kezdőár
$2.48 / month
CPU
AMD EPYC · DDR5
Kiépítés
60 másodperc
Régiók
12 világszerte
Pénzvisszafizetés
14 nap
Alapított
2008

Miért választják a fejlesztők a Cloudzy-t

Egy technikai tudású kedvenc

A négy szempont, amelyen a vásárlók ténylegesen összehasonlítanak minket - és mindegyiken helytállunk.

Csúcskategóriás infrastruktúra

Legújabb generációs AMD EPYC, kizárólag NVMe-alapú tárolás, DDR5 memória, 40 Gbps uplink kapcsolatok. Egyszálas teljesítményben vezető szerepet töltünk be minden csomagszinten.

Kockázatmentes próbaidőszak

14 napos pénzvisszafizetési garancia minden csomagra. Kérdések nélkül. Telepítési díj nincsen. Bármikor lemondható az irányítópultról.

99,95% üzemidő SLA

Automatikus monitorozás 12 régióban. Az elmúlt 30 nap SLA adatai nyilvánosan követhetők a status.cloudzy.com oldalon, semmi nincs elrejtve.

24/7 emberi támogatás

Élő chat és jegyválaszok jellemzően 5 percen belül. Mérnökök, nem forgatókönyv-olvasók. Medián megoldási idő 1 óra alatt.

Önállóan futtatható AI-eszközök

Nyílt súlyozású modellek, az Ön infrastruktúrája.

Futtass bármilyen nyílt súlyozású modellt vagy AI-keretrendszert. Teljes root-hozzáféréssel te választod meg a stacket, a modellt és a kiszolgálási réteget. Nincs szükség harmadik féltől származó API-kulcsokra.

Ollama
Egyetlen paranccsal induló LLM-kiszolgálás
llama.cpp
CPU-optimalizált következtetés
vLLM
Nagy áteresztőképességű kiszolgálás
Nyissa meg a WebUI-t
Chat-felület LLM-ekhez
LangChain
Orkesztráció keretrendszer
Hugging Face
Modellközpont + Transformers

Felhasználási esetek

Miért választják a fejlesztők
Cloudzy ChatGPT VPS-ja.

Privát ChatGPT-alternatíva

Futtasd a Llama 3-at, a Mistral-t vagy a Phi-t a saját szerveredén az Open WebUI segítségével. Chat-felület, előzmények, az adatok nem hagyják el a VPS-t.

API-backend az alkalmazásodhoz

Tedd elérhetővé az LLM-t a saját REST API-ed mögött. Nincs tokenalapú számlázás, nincs sebességkorlát. Integráld a SaaS-oddal, bottal vagy belső eszközzel.

Finomhangolás és kísérletek

Tölts fel adatkészleteket, hangolj finomra LoRA-adaptereket, futtass kiértékeléseket. A tartós NVMe-tárolónak köszönhetően az ellenőrzőpontjaid újraindítás után is megmaradnak.

RAG-pipeline szerver

Kombináld a helyi LLM-t egy vektoros adatbázissal (Chroma, Qdrant, Weaviate) a visszakereséssel augmentált generáláshoz. Minden egyetlen gépen.

Többmodelles összehasonlítás

Futtasd egyszerre a Llama-t, a Mistral-t és a Phi-t. Hasonlítsd össze a kimeneteket, a késleltetést és a minőséget, mielőtt élesbe vinnél egy modellt.

AI kódolási asszisztens

Hosztold saját magad a Code Llama-t vagy a DeepSeek Coder-t, és kösd össze az IDE-ddel egy helyi API-on keresztül. Automatikus kiegészítés és chat – kód nem kerül ki külső szerverre.

60s
Kiépítés
40 Gbps
Felfelé mutató kapcsolat
Csak NVMe
Tárolás
12
Régiók
99.95%
Üzemidő SLA
14 nap
Pénzvisszafizetés

Globális hálózat

12 régió. Négy kontinens.
Egy kattintásra.

Telepítsd a ChatGPT VPS-t a lehető legközelebb a felhasználóidhoz. P50 medián késleltetés 10 ms alatt Észak-Amerikában és Európában.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Árazás

Csak annyit fizet, amennyit használ. Ez az.

Óránként, havonta vagy évente. Kimenő forgalmi díj nélkül. Kötöttségek nélkül. Jelenleg 50% kedvezmény az összes csomag.

512 MB DDR5

Kis modellek · tesztelés

$2.48 /hó
$4.95/mo −50%
Telepítés most
14 napos visszatérítési garancia
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Dedikált IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

Kis LLM-ek · 7B paraméter

$7.475 /hó
$14.95/mo −50%
Telepítés most
14 napos visszatérítési garancia
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedikált IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

13B+ modellek · RAG stack-ek

$26.475 /hó
$52.95/mo −50%
Telepítés most
14 napos visszatérítési garancia
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Dedikált IPv4 + IPv6
  • Root SSH · KVM

GYIK — ChatGPT VPS

Gyakori kérdések egyenes válaszok.

Futtathatom a ChatGPT-t saját VPS-en?

Maga a ChatGPT az OpenAI saját zárt szolgáltatása, de nyílt súlyú alternatívákat – például Llama 3-at, Mistral-t, Phi-t vagy DeepSeek-et – saját Cloudzy VPS-en is futtathatsz. Az Ollama és az Open WebUI hasonló chat-élményt nyújt, teljes adatvédelemmel.

Mennyi RAM kell LLM inferenciához?

A modell méretétől függ. Egy 7B paraméteres modell (például a kvantált Llama 3 8B) 4–8 GB RAM-el fut. Egy 13B-es modellhez 8–16 GB kell. A nagyobb, 70B-es modellekhez 32–64 GB szükséges. Kis modellekhez kezdj a 4 GB-os csomaggal, és bővítsd igény szerint.

Szükséges GPU a LLM-ek futtatásához?

Nem. Az olyan eszközök, mint a llama.cpp és az Ollama, AMD EPYC-on futó CPU-alapú inferenciára is optimalizáltak. A tokens/másodperc sebesség alacsonyabb, mint GPU esetén, de személyes használatra, kis csapatoknak vagy aszinkron batch feladatokhoz a CPU-alapú inferencia tökéletesen megfelel – és töredékébe kerül a GPU-alapú hosztingnak.

Futtathatok egyszerre több modellt?

Igen. Elegendő RAM mellett több modellt is futtathatasz az Ollama-en vagy a vLLM-en keresztül, és igény szerint válthatsz köztük. Minden modell igény esetén töltődik be a memóriába. Egy 16 GB-os csomag kényelmesen kiszolgál 2–3 kis modellt párhuzamosan.

Mi a helyzet az adatvédelemmel?

Minden az VPS-eden marad. Semmilyen adat nem kerül harmadik feles API-ekre. Te irányítod a modellt, az adatokat és a hálózatot. Ez a fő előny a felhőalapú AI-szolgáltatásokhoz képest: a promptjaid és a válaszok sosem hagyják el a szerveredet.

Hogyan telepítsem az Ollama-t?

Egyetlen parancs: curl -fsSL https://ollama.ai/install.sh | sh. Ezután tölts le egy modellt az ollama pull llama3 paranccsal, és máris chatelj. Az egész folyamat friss VPS-en 5 percen belül elvégezhető.

Elérhetővé tehetem a LLM-emet API-ként?

Igen. Az Ollama alapértelmezés szerint OpenAI-kompatibilis API-t szolgál ki a 11434-es porton. A vLLM szintén OpenAI-kompatibilis végpontot tesz elérhetővé. Irányítsd az alkalmazásodat, botodat vagy a frontendedet az VPS-ed IP-címére és portjára.

Milyen rendelkezésre állást garantálnak?

Az Cloudzy 99,95%-os rendelkezésre állási SLA-t vállal minden csomagra. Az AI-szervered éjjel-nappal online marad, redundáns hálózati útvonalakkal és 40 Gbps sávszélességgel.

Finomhangolhatok modelleket ezen az VPS-n?

Az CPU finomhangolása lehetséges, de lassú. Kis modellek (7B) LoRA/QLoRA finomhangolásához egy magas RAM-s CPU csomag kísérletezésre megfelel. Nagy modellek éles finomhangolásához az GPU példányok praktikusabbak.

Mi a pénzvisszafizetési szabályzat?

14 napos pénzvisszafizetési garancia, feltétel nélkül. Teszteld az AI konfigurációdat, mérd meg az inferencia sebességét, majd döntsd el. Teljes visszatérítés az irányítópultról vagy a supporton keresztül.

Készen állunk, ha te is készen vagy.
AI szerver 60 másodperc alatt.

Nem szükséges bankkártya · 14 napos pénzvisszafizetési garancia · Bármikor lemondható