Přejít na hlavní obsah
Sleva 50% všechny plány, omezený čas. Od $2.48/mo

Hosting pro ChatGPT VPS

Váš vlastní AI server,
vlastní pravidla.

Self-host open-weight LLMs and AI APIs on AMD EPYC with NVMe storage.
Independent cloud since 2008, no vendor lock-in, no usage caps.
Trusted by 122,000+ users · from $2.48/mo.

4.7 · 755 reviews on Trustpilot

Od $2.48/mo · Sleva 50% · Bez kreditní karty

~ ssh root@ai-001 připojen
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Installing Ollama...
Ollama installed successfully.
root@ai-001:~# ollama pull llama3
pulling model llama3... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS na první pohled

Cloudzy offers ChatGPT VPS hosting for self-hosting LLMs and AI inference across 13 regions, starting at $2.48/mo. Every plan runs on AMD EPYC with DDR5 memory, NVMe storage, and 40 Gbps uplinks. Install Ollama, llama.cpp, vLLM, or your own inference stack, full root access, no API rate limits. Provision in 60 seconds. Independent since 2008, rated 4.7/5 by 700+ reviewers on Trustpilot.

Cena od
2,48 $ / měsíc
CPU
AMD EPYC · DDR5
Zřizování
60 sekund
Oblasti
13 po celém světě
Vrácení peněz
14 dní
Založeno
2008

Proč si vývojáři vybírají Cloudzy

Technicky zdatný oblíbené

Čtyři věci, na kterých nás zákazníci skutečně srovnávají. Uděláno správně.

Vysoce výkonná infrastruktura

Nejnovější generace AMD EPYC, čisté NVMe úložiště, paměť DDR5, uplinky 40 Gbps. Vedoucí pozice v single-thread výkonu na všech úrovních plánů.

Vyzkoušej bez rizika

Vrácení peněz do 14 dnů u každého plánu. Bez otázek. Žádné zaváděcí poplatky. Zruš kdykoli z dashboardu.

99,95% SLA dostupnosti

Automatický monitoring napříč 13 regiony. Naše SLA za posledních 30 dní je veřejně sledovatelné na status.cloudzy.com. Nic neskrýváme.

Lidská podpora 24/7

Odpovědi na chatu a tickety obvykle do 5 minut. Inženýři, ne čtenáři skriptů. Medián vyřešení pod 1 hodinu.

Nástroje AI pro vlastní hosting

Open-weight models, your infrastructure.

Spusťte libovolný open-weight model nebo AI framework. Plný root přístup znamená, že si sami zvolíte stack, model i serving vrstvu. Žádné API klíče od třetích stran nejsou potřeba.

Ollama
Spuštění LLM jediným příkazem
llama.cpp
Inference optimalizované pro CPU
vLLM
Vysokorychlostní obsluha požadavků
Open WebUI
Chatové rozhraní pro LLMs
LangChain
Framework pro orchestraci
Hugging Face
Středisko modelů + Transformers

Případy použití

Proč si vývojáři vybírají
Cloudzy's ChatGPT VPS.

Soukromá alternativa k ChatGPT

Spusťte Llama 3, Mistral nebo Phi na vlastním serveru s Open WebUI. Chatovací rozhraní, historie konverzací, žádná data neopustí vaši VPS.

API backend pro vaši aplikaci

Provozujte LLM za vlastním REST API. Žádné účtování za tokeny, žádné limity požadavků. Napojte na svůj SaaS, bota nebo interní nástroj.

Doladění a experimenty

Nahrajte datové sady, dolaďte LoRA adaptéry, spusťte evaluace. Perzistentní úložiště NVMe zajistí, že vaše checkpointy přežijí restarty.

Server pro RAG pipeline

Kombinujte lokální LLM s vektorovou databází (Chroma, Qdrant, Weaviate) pro retrieval-augmented generation. Vše na jednom stroji.

Porovnání více modelů

Spusťte Llama, Mistral a Phi vedle sebe. Porovnejte výstupy, latenci a kvalitu předtím, než se v produkci rozhodnete pro jeden model.

Asistent pro kódování s umělou inteligencí

Hostujte si Code Llama nebo DeepSeek Coder a připojte je k vašemu IDE přes lokální API. Automatické doplňování a chat bez odesílání kódu ven.

60s
Zřizování
40 Gbps
Spojení nahoru
Pouze NVMe
Úložiště
13
Oblasti
99.95%
SLA dostupnosti
14 days
Vrácení peněz

Globální síť

13 regionů. Čtyři kontinenty.
Jedno kliknutí daleko.

Umístěte svůj ChatGPT VPS co nejblíže uživatelům. Medián latence P50 pod 10 ms v Severní Americe a Evropě.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Ceny

Plaťte jen za to, co využíváte. To je celé.

Hodinově, měsíčně, nebo ročně. Žádné poplatky za egress. Žádné závazky. Aktuálně Sleva 50% všechny plány.

512 MB DDR5

Malé modely · testování

$2.48 /mo
$4.95/mo −50%
Nasadit hned
Vrácení peněz do 14 dnů
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Dedikovaná IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

Malé LLM · 7B parametrů

$7.475 /mo
$14.95/mo −50%
Nasadit hned
Vrácení peněz do 14 dnů
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedikovaná IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

Modely 13B+ · RAG stacky

$26.475 /mo
$52.95/mo −50%
Nasadit hned
Vrácení peněz do 14 dnů
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Dedikovaná IPv4 + IPv6
  • Root SSH · KVM

Často kladené otázky — ChatGPT VPS

Běžné otázky, přímé odpovědi.

Mohu spustit ChatGPT na vlastní VPS?

ChatGPT samotný je proprietární služba OpenAI, ale na vlastní Cloudzy VPS můžete provozovat open-weight alternativy jako Llama 3, Mistral, Phi nebo DeepSeek. Nástroje jako Ollama a Open WebUI vám nabídnou podobný chatovací zážitek s plnou ochranou soukromí.

Kolik RAM potřebuji pro inferenci LLM?

Záleží na velikosti modelu. Model s 7B parametry (například kvantizovaný Llama 3 8B) běží na 4–8 GB RAM. Model 13B potřebuje 8–16 GB. Větší modely 70B vyžadují 32–64 GB. Pro malé modely začněte s plánem 4 GB a podle potřeby škálujte výš.

Je GPU nutné pro provoz LLM?

Ne. Nástroje jako llama.cpp a Ollama jsou optimalizovány pro inferenci na CPU přes AMD EPYC. Tokeny za sekundu budou pomalejší než na GPU, ale pro osobní použití, malé týmy nebo asynchronní dávkové úlohy CPU inference funguje spolehlivě a stojí zlomek ceny GPU hostingu.

Mohu hostovat více modelů najednou?

Ano. S dostatkem RAM můžete přes Ollama nebo vLLM spustit více modelů a přepínat mezi nimi. Každý model se načte do paměti na vyžádání. Plán s 16 GB zvládne pohodlně obsluhovat 2–3 malé modely současně.

Co ochrana dat?

Vše zůstává na vašem VPS. Žádná data se neodesílají externím APIům. Vy kontrolujete model, data i síť. To je hlavní výhoda oproti hostovaným AI službám – vaše prompty a odpovědi nikdy neopustí váš server.

Jak nainstaluji Ollama?

Jeden příkaz: curl -fsSL https://ollama.ai/install.sh | sh. Pak stáhněte model přes ollama pull llama3 a můžete začít. Na čistém VPS celý proces zabere méně než 5 minut.

Mohu zpřístupnit svůj LLM jako API?

Ano. Ollama ve výchozím nastavení poskytuje OpenAI-kompatibilní API na portu 11434. vLLM také vystavuje OpenAI-kompatibilní endpoint. Nasměrujte svou aplikaci, bota nebo frontend na IP adresu a port vašeho VPS.

Jaká je záruka dostupnosti?

Cloudzy nabízí garanci dostupnosti 99,95 % napříč všemi plány. Váš AI server běží nepřetržitě díky redundantním síťovým cestám a konektivitě 40 Gbps.

Mohu na tomto VPS dolaďovat modely?

Doladění CPU je možné, ale pomalé. Pro LoRA/QLoRA fine-tuning malých modelů (7B) poslouží plán s výkonným CPU k experimentování. Pro produkční fine-tuning velkých modelů jsou praktičtější instance GPU.

Jaká je zásada vrácení peněz?

14denní záruka vrácení peněz, bez otázek. Otestujte své AI prostředí, změřte rychlost inference a rozhodněte se. Plnou náhradu vyřídíte přes dashboard nebo podporu.

Připraveni, kdykoli jste vy.
AI server za 60 sekund.

Bez platební karty · Vrácení peněz do 14 dnů · Zruš kdykoli