Sleva 50% všechny plány, časově omezená nabídka. Od $2.48/mo

Hosting pro ChatGPT VPS

Váš vlastní AI server,
vlastní pravidla.

Provozujte open-weight LLMs a AI APIs na vlastním serveru na AMD EPYC s NVMe úložiště.
Nezávislý cloud od roku 2008, žádné závislosti na dodavateli, žádné limity využití.
Důvěřují mu 122,000+ uživatelé · od $2.48/mo.

4.6 · 721 reviews on Trustpilot

Začínající na $2.48/mo · 50% sleva · Bez kreditní karty

~ ssh root@ai-001 připojen
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Instalace Ollama...
Ollama byl úspěšně nainstalován.
root@ai-001:~# ollama pull llama3
stahování modelu llama3... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS na první pohled

Cloudzy nabízí ChatGPT VPS hosting pro self-hosting LLMs a AI inference 12 regionů, počínaje od $2.48/mo. Každý plán běží na AMD EPYC s DDR5 paměť, NVMe úložiště a 40 Gbps uplinky. Nainstalujte Ollama, llama.cpp, vLLM nebo vlastní inference stack – plný root přístup, žádné limity API. Zprovoznění za 60 sekund. Nezávislá od 2008, hodnoceno 4.6/5 by 679+ recenzentů na Trustpilot.

Počáteční cena
$2.48 / month
CPU
AMD EPYC · DDR5
Zřizování
60 sekund
Oblasti
12 celosvětově
Vrácení peněz
14 dní
Založeno
2008

Proč vývojáři volí Cloudzy

Technicky zdatný oblíbené

Čtyři věci, podle kterých nás zákazníci skutečně porovnávají. Zvládáme je dobře.

Výkonná infrastruktura

Nejnovější AMD EPYC, úložiště výhradně na NVMe, DDR5 paměť, uplinky 40 Gbps. Nejlepší výkon v jednom vlákně v každém cenovém pásmu.

Vyzkoušení bez rizika

Ke každému plánu poskytujeme 14denní garanci vrácení peněz. Bez otázek. Bez poplatků za zřízení. Zrušit lze kdykoli přímo z ovládacího panelu.

99,95% SLA dostupnosti

Automatizovaný monitoring ve 12 regionech. Naše SLA za posledních 30 dní je veřejně sledována na status.cloudzy.com – nic neskrýváme.

Lidská podpora 24/7

Live chat a odpovědi na tikety zpravidla do 5 minut. Odpovídají technici, ne roboti. Medián doby řešení pod 1 hodinu.

Nástroje AI pro vlastní hosting

Open-weight modely, vaší infrastruktury.

Spusťte libovolný open-weight model nebo AI framework. Plný root přístup znamená, že si sami zvolíte stack, model i serving vrstvu. Žádné API klíče od třetích stran nejsou potřeba.

Ollama
Spuštění LLM jediným příkazem
llama.cpp
Inference optimalizované pro CPU
vLLM
Vysokorychlostní obsluha požadavků
Otevřít WebUI
Chatové rozhraní pro LLMs
LangChain
Framework pro orchestraci
Hugging Face
Středisko modelů + Transformers

Případy použití

Proč si vývojáři vybírají
Cloudzy's ChatGPT VPS.

Soukromá alternativa k ChatGPT

Spusťte Llama 3, Mistral nebo Phi na vlastním serveru s Open WebUI. Chatovací rozhraní, historie konverzací, žádná data neopustí vaši VPS.

API backend pro vaši aplikaci

Provozujte LLM za vlastním REST API. Žádné účtování za tokeny, žádné limity požadavků. Napojte na svůj SaaS, bota nebo interní nástroj.

Doladění a experimenty

Nahrajte datové sady, dolaďte LoRA adaptéry, spusťte evaluace. Perzistentní úložiště NVMe zajistí, že vaše checkpointy přežijí restarty.

Server pro RAG pipeline

Kombinujte lokální LLM s vektorovou databází (Chroma, Qdrant, Weaviate) pro retrieval-augmented generation. Vše na jednom stroji.

Porovnání více modelů

Spusťte Llama, Mistral a Phi vedle sebe. Porovnejte výstupy, latenci a kvalitu předtím, než se v produkci rozhodnete pro jeden model.

Asistent pro kódování s umělou inteligencí

Hostujte si Code Llama nebo DeepSeek Coder a připojte je k vašemu IDE přes lokální API. Automatické doplňování a chat bez odesílání kódu ven.

60s
Zřizování
40 Gbps
Spojení nahoru
Pouze NVMe
Úložiště
12
Oblasti
99.95%
Dostupnost SLA
14 dní
Vrácení peněz

Globální síť

12 regionů. Čtyři kontinenty.
Na jedno kliknutí.

Umístěte svůj ChatGPT VPS co nejblíže uživatelům. Medián latence P50 pod 10 ms v Severní Americe a Evropě.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Ceny

Plaťte jen za to, co skutečně využijete. To je vše.

Hodinově, měsíčně nebo ročně. Bez poplatků za odchozí provoz. Bez závazků. Aktuálně Sleva 50% všechny plány.

512 MB DDR5

Malé modely · testování

$2.48 /měsíc
$4.95/mo −50%
Nasadit nyní
14denní záruka vrácení peněz
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Dedikovaná IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

Malé LLM · 7B parametrů

$7.475 /měsíc
$14.95/mo −50%
Nasadit nyní
14denní záruka vrácení peněz
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedikovaná IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

Modely 13B+ · RAG stacky

$26.475 /měsíc
$52.95/mo −50%
Nasadit nyní
14denní záruka vrácení peněz
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Dedikovaná IPv4 + IPv6
  • Root SSH · KVM

Časté otázky — ChatGPT VPS

Běžné otázky, přímé odpovědi.

Mohu spustit ChatGPT na vlastní VPS?

ChatGPT samotný je proprietární služba OpenAI, ale na vlastní Cloudzy VPS můžete provozovat open-weight alternativy jako Llama 3, Mistral, Phi nebo DeepSeek. Nástroje jako Ollama a Open WebUI vám nabídnou podobný chatovací zážitek s plnou ochranou soukromí.

Kolik RAM potřebuji pro inferenci LLM?

Záleží na velikosti modelu. Model s 7B parametry (například kvantizovaný Llama 3 8B) běží na 4–8 GB RAM. Model 13B potřebuje 8–16 GB. Větší modely 70B vyžadují 32–64 GB. Pro malé modely začněte s plánem 4 GB a podle potřeby škálujte výš.

Je GPU nutné pro provoz LLM?

Ne. Nástroje jako llama.cpp a Ollama jsou optimalizovány pro inferenci na CPU přes AMD EPYC. Tokeny za sekundu budou pomalejší než na GPU, ale pro osobní použití, malé týmy nebo asynchronní dávkové úlohy CPU inference funguje spolehlivě a stojí zlomek ceny GPU hostingu.

Mohu hostovat více modelů najednou?

Ano. S dostatkem RAM můžete přes Ollama nebo vLLM spustit více modelů a přepínat mezi nimi. Každý model se načte do paměti na vyžádání. Plán s 16 GB zvládne pohodlně obsluhovat 2–3 malé modely současně.

Co ochrana dat?

Vše zůstává na vašem VPS. Žádná data se neodesílají externím APIům. Vy kontrolujete model, data i síť. To je hlavní výhoda oproti hostovaným AI službám – vaše prompty a odpovědi nikdy neopustí váš server.

Jak nainstaluji Ollama?

Jeden příkaz: curl -fsSL https://ollama.ai/install.sh | sh. Pak stáhněte model přes ollama pull llama3 a můžete začít. Na čistém VPS celý proces zabere méně než 5 minut.

Mohu zpřístupnit svůj LLM jako API?

Ano. Ollama ve výchozím nastavení poskytuje OpenAI-kompatibilní API na portu 11434. vLLM také vystavuje OpenAI-kompatibilní endpoint. Nasměrujte svou aplikaci, bota nebo frontend na IP adresu a port vašeho VPS.

Jaká je záruka dostupnosti?

Cloudzy nabízí garanci dostupnosti 99,95 % napříč všemi plány. Váš AI server běží nepřetržitě díky redundantním síťovým cestám a konektivitě 40 Gbps.

Mohu na tomto VPS dolaďovat modely?

Doladění CPU je možné, ale pomalé. Pro LoRA/QLoRA fine-tuning malých modelů (7B) poslouží plán s výkonným CPU k experimentování. Pro produkční fine-tuning velkých modelů jsou praktičtější instance GPU.

Jaká je zásada vrácení peněz?

14denní záruka vrácení peněz, bez otázek. Otestujte své AI prostředí, změřte rychlost inference a rozhodněte se. Plnou náhradu vyřídíte přes dashboard nebo podporu.

Připraven, když si přeješ.
AI server za 60 sekund.

Bez nutnosti platební karty · 14denní záruka vrácení peněz · Zrušení kdykoliv