50% off minden csomagra, korlátozott ideig. Kezdőár: $2.48/mo

ChatGPT VPS Hosting

Saját AI szervered,
a saját szabályaid szerint.

Nyílt súlyú LLMs és AI APIs saját szerveren futtatása AMD EPYC with NVMe storage.
Független felhőszolgáltató 2008, nincs vendor lock-in, nincs használati korlát.
Trusted by 122,000+ users · from $2.48/mo.

4.6 · 713 reviews on Trustpilot

Starting at $2.48/mo · 50% kedvezmény · Bankkártya nem szükséges

~ ssh root@ai-001 connected
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Installing Ollama...
Ollama sikeresen telepítve.
root@ai-001:~# ollama pull llama3
pulling model llama3... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS egy pillantásra

Cloudzy offers ChatGPT VPS tárhely LLM-ek önálló futtatásához és AI-következtetéshez 12 regions, starting at $2.48/mo. Minden csomag AMD EPYC with DDR5 memory, NVMe storage, and 40 Gbps uplink-ek. Telepítsd a Ollama-t, a llama.cpp-t, a vLLM-t, vagy a saját inference-stackedet, teljes root-hozzáféréssel, API-sebességkorlát nélkül. Üzembe helyezés 60 seconds. Independent since 2008, rated 4.6/5 by 679+ reviewers on Trustpilot.

Starting price
$2.48 / month
CPU
AMD EPYC · DDR5
Provisioning
60 seconds
Regions
12 worldwide
Money-back
14 days
Founded
2008

Miért választják a fejlesztők a Cloudzy-t

A tech-savvy favorite.

A négy szempont, amelyen a vásárlók ténylegesen összehasonlítanak minket - és mindegyiken helytállunk.

Csúcskategóriás infrastruktúra

Legújabb generációs AMD EPYC, kizárólag NVMe-alapú tárolás, DDR5 memória, 40 Gbps uplink kapcsolatok. Egyszálas teljesítményben vezető szerepet töltünk be minden csomagszinten.

Kockázatmentes próbaidőszak

14 napos pénzvisszafizetési garancia minden csomagra. Kérdések nélkül. Telepítési díj nincsen. Bármikor lemondható az irányítópultról.

99.95% uptime SLA

Automatikus monitorozás 12 régióban. Az elmúlt 30 nap SLA adatai nyilvánosan követhetők a status.cloudzy.com oldalon, semmi nincs elrejtve.

24/7 human support

Élő chat és jegyválaszok jellemzően 5 percen belül. Mérnökök, nem forgatókönyv-olvasók. Medián megoldási idő 1 óra alatt.

Önállóan futtatható AI-eszközök

Nyílt súlyozású modellek, your infrastructure.

Futtass bármilyen nyílt súlyozású modellt vagy AI-keretrendszert. Teljes root-hozzáféréssel te választod meg a stacket, a modellt és a kiszolgálási réteget. Nincs szükség harmadik féltől származó API-kulcsokra.

Ollama
Egyetlen paranccsal induló LLM-kiszolgálás
llama.cpp
CPU-optimalizált következtetés
vLLM
Nagy áteresztőképességű kiszolgálás
Open WebUI
Chat-felület LLM-ekhez
LangChain
Orchestration framework
Hugging Face
Modellközpont + Transformers

Use cases

Miért választják a fejlesztők
Cloudzy ChatGPT VPS-ja.

Privát ChatGPT-alternatíva

Futtasd a Llama 3-at, a Mistral-t vagy a Phi-t a saját szerveredén az Open WebUI segítségével. Chat-felület, előzmények, az adatok nem hagyják el a VPS-t.

API-backend az alkalmazásodhoz

Tedd elérhetővé az LLM-t a saját REST API-ed mögött. Nincs tokenalapú számlázás, nincs sebességkorlát. Integráld a SaaS-oddal, bottal vagy belső eszközzel.

Finomhangolás és kísérletek

Tölts fel adatkészleteket, hangolj finomra LoRA-adaptereket, futtass kiértékeléseket. A tartós NVMe-tárolónak köszönhetően az ellenőrzőpontjaid újraindítás után is megmaradnak.

RAG-pipeline szerver

Kombináld a helyi LLM-t egy vektoros adatbázissal (Chroma, Qdrant, Weaviate) a visszakereséssel augmentált generáláshoz. Minden egyetlen gépen.

Többmodelles összehasonlítás

Futtasd egyszerre a Llama-t, a Mistral-t és a Phi-t. Hasonlítsd össze a kimeneteket, a késleltetést és a minőséget, mielőtt élesbe vinnél egy modellt.

AI coding assistant

Hosztold saját magad a Code Llama-t vagy a DeepSeek Coder-t, és kösd össze az IDE-ddel egy helyi API-on keresztül. Automatikus kiegészítés és chat – kód nem kerül ki külső szerverre.

60s
Provisioning
40 Gbps
Uplink
NVMe-only
Storage
12
Regions
99.95%
Uptime SLA
14 days
Money-back

Global network

12 régió. Négy kontinens.
Egy kattintásra.

Telepítsd a ChatGPT VPS-t a lehető legközelebb a felhasználóidhoz. P50 medián késleltetés 10 ms alatt Észak-Amerikában és Európában.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Pricing

Csak annyit fizet, amennyit használ. That's it.

Óránként, havonta vagy évente. Kimenő forgalmi díj nélkül. Kötöttségek nélkül. Jelenleg 50% off all plans.

512 MB DDR5

Kis modellek · tesztelés

$2.48 /mo
$4.95/mo −50%
Deploy now
14 napos visszatérítési garancia
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

Kis LLM-ek · 7B paraméter

$7.475 /mo
$14.95/mo −50%
Deploy now
14 napos visszatérítési garancia
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

13B+ modellek · RAG stack-ek

$26.475 /mo
$52.95/mo −50%
Deploy now
14 napos visszatérítési garancia
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM

GYIK — ChatGPT VPS

Common questions, straight answers.

Futtathatom a ChatGPT-t saját VPS-en?

Maga a ChatGPT az OpenAI saját zárt szolgáltatása, de nyílt súlyú alternatívákat – például Llama 3-at, Mistral-t, Phi-t vagy DeepSeek-et – saját Cloudzy VPS-en is futtathatsz. Az Ollama és az Open WebUI hasonló chat-élményt nyújt, teljes adatvédelemmel.

Mennyi RAM kell LLM inferenciához?

A modell méretétől függ. Egy 7B paraméteres modell (például a kvantált Llama 3 8B) 4–8 GB RAM-el fut. Egy 13B-es modellhez 8–16 GB kell. A nagyobb, 70B-es modellekhez 32–64 GB szükséges. Kis modellekhez kezdj a 4 GB-os csomaggal, és bővítsd igény szerint.

Szükséges GPU a LLM-ek futtatásához?

Nem. Az olyan eszközök, mint a llama.cpp és az Ollama, AMD EPYC-on futó CPU-alapú inferenciára is optimalizáltak. A tokens/másodperc sebesség alacsonyabb, mint GPU esetén, de személyes használatra, kis csapatoknak vagy aszinkron batch feladatokhoz a CPU-alapú inferencia tökéletesen megfelel – és töredékébe kerül a GPU-alapú hosztingnak.

Futtathatok egyszerre több modellt?

Igen. Elegendő RAM mellett több modellt is futtathatasz az Ollama-en vagy a vLLM-en keresztül, és igény szerint válthatsz köztük. Minden modell igény esetén töltődik be a memóriába. Egy 16 GB-os csomag kényelmesen kiszolgál 2–3 kis modellt párhuzamosan.

Mi a helyzet az adatvédelemmel?

Minden az VPS-eden marad. Semmilyen adat nem kerül harmadik feles API-ekre. Te irányítod a modellt, az adatokat és a hálózatot. Ez a fő előny a felhőalapú AI-szolgáltatásokhoz képest: a promptjaid és a válaszok sosem hagyják el a szerveredet.

Hogyan telepítsem az Ollama-t?

Egyetlen parancs: curl -fsSL https://ollama.ai/install.sh | sh. Ezután tölts le egy modellt az ollama pull llama3 paranccsal, és máris chatelj. Az egész folyamat friss VPS-en 5 percen belül elvégezhető.

Elérhetővé tehetem a LLM-emet API-ként?

Igen. Az Ollama alapértelmezés szerint OpenAI-kompatibilis API-t szolgál ki a 11434-es porton. A vLLM szintén OpenAI-kompatibilis végpontot tesz elérhetővé. Irányítsd az alkalmazásodat, botodat vagy a frontendedet az VPS-ed IP-címére és portjára.

Milyen rendelkezésre állást garantálnak?

Az Cloudzy 99,95%-os rendelkezésre állási SLA-t vállal minden csomagra. Az AI-szervered éjjel-nappal online marad, redundáns hálózati útvonalakkal és 40 Gbps sávszélességgel.

Finomhangolhatok modelleket ezen az VPS-n?

Az CPU finomhangolása lehetséges, de lassú. Kis modellek (7B) LoRA/QLoRA finomhangolásához egy magas RAM-s CPU csomag kísérletezésre megfelel. Nagy modellek éles finomhangolásához az GPU példányok praktikusabbak.

Mi a pénzvisszafizetési szabályzat?

14 napos pénzvisszafizetési garancia, feltétel nélkül. Teszteld az AI konfigurációdat, mérd meg az inferencia sebességét, majd döntsd el. Teljes visszatérítés az irányítópultról vagy a supporton keresztül.

Készen állunk, ha te is készen vagy.
AI server in 60 seconds.

Nem szükséges bankkártya · 14 napos pénzvisszafizetési garancia · Bármikor lemondható