Gå til hovedindhold
50% rabat alle planer, tidsbegrænset. Fra $2.48/mo

ChatGPT VPS-hosting

Din egen AI-server,
dine egne regler.

Self-host open-weight LLMs and AI APIs on AMD EPYC with NVMe storage.
Independent cloud since 2008, no vendor lock-in, no usage caps.
Trusted by 122,000+ users · from $2.48/mo.

4.7 · 755 reviews on Trustpilot

Fra $2.48/mo · 50% rabat · Ingen kreditkort påkrævet

~ ssh root@ai-001 forbundet
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Installing Ollama...
Ollama installed successfully.
root@ai-001:~# ollama pull llama3
pulling model llama3... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS i overblik

Cloudzy offers ChatGPT VPS hosting for self-hosting LLMs and AI inference across 13 regions, starting at $2.48/mo. Every plan runs on AMD EPYC with DDR5 memory, NVMe storage, and 40 Gbps uplinks. Install Ollama, llama.cpp, vLLM, or your own inference stack, full root access, no API rate limits. Provision in 60 seconds. Independent since 2008, rated 4.7/5 by 700+ reviewers on Trustpilot.

Startpris
2,48 $ / måned
CPU
AMD EPYC · DDR5
Klargøring
60 sekunder
Regioner
13 globalt
Penge-tilbage
14 dage
Grundlagt
2008

Hvorfor udviklere vælger Cloudzy

En teknisk stærk favorit

De fire ting, kunder faktisk sammenligner os på, gjort rigtigt.

High-spec infrastruktur

Nyeste generation AMD EPYC, kun NVMe-lagring, DDR5-hukommelse, 40 Gbps uplinks. Førende single-thread-ydelse på alle planniveauer.

Risikofri prøveperiode

14 dages pengene-tilbage-garanti på alle planer. Ingen spørgsmål stillet. Ingen opsætningsgebyrer. Opsig når som helst fra dashboardet.

99,95 % oppetids-SLA

Automatisk overvågning på tværs af 13 regioner. Vores SLA for de seneste 30 dage følges offentligt på status.cloudzy.com. Vi gemmer intet.

Menneskelig support døgnet rundt

Live chat og ticket-svar typisk under 5 minutter. Ingeniører, ikke manuskriptlæsere. Median løsningstid under 1 time.

AI-værktøjer du kan self-hoste

Open-weight models, your infrastructure.

Kør enhver open-weight-model eller AI-framework. Fuld root-adgang betyder, at du selv vælger stak, model og serveringslag. Ingen API-nøgler fra tredjeparter krævet.

Ollama
LLM-servering med én kommando
llama.cpp
CPU-optimeret inferens
vLLM
Servering med høj gennemstrømning
Open WebUI
Chatgrænseflade til LLMs
LangChain
Orkestreringsramme
Hugging Face
Model-hub + Transformers

Brugsscenarier

Hvorfor udviklere vælger
Cloudzys ChatGPT VPS.

Privat ChatGPT-alternativ

Kør Llama 3, Mistral eller Phi på din egen server med Open WebUI. Chatgrænseflade, samtalehistorik, ingen data forlader dit VPS.

API-backend til din app

Server en LLM bag dit eget REST API. Ingen fakturering per token, ingen hastighedsbegrænsninger. Integrer med din SaaS, bot eller interne værktøj.

Finjustering og eksperimenter

Upload datasæt, finjuster LoRA-adaptere, kør evalueringer. Vedvarende NVMe-lager betyder, at dine checkpoints overlever genstarter.

RAG-pipeline-server

Kombiner en lokal LLM med en vektor-DB (Chroma, Qdrant, Weaviate) til retrieval-augmented generation. Alt på én server.

Multi-model sammenligning

Kør Llama, Mistral og Phi side om side. Sammenlign output, latenstid og kvalitet, inden du vælger én model til produktion.

AI-kodningsassistent

Self-host Code Llama eller DeepSeek Coder og forbind det til dit IDE via en lokal API. Auto-complete og chat uden at sende kode eksternt.

60s
Klargøring
40 Gbps
Oplink
NVMe-kun
Lagring
13
Regioner
99.95%
Oppetids-SLA
14 days
Penge-tilbage

Globalt netværk

13 regioner. Fire kontinenter.
Ét klik væk.

Placér din ChatGPT VPS så tæt på dine brugere, som fysikken tillader. Median P50-latenstid under 10 ms i Nordamerika og Europa.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Priser

Betal kun for det, du bruger. Det var det.

Time, måned eller år. Ingen egress-gebyrer. Ingen binding. Lige nu 50% rabat alle planer.

512 MB DDR5

Små modeller · test

$2.48 /mo
$4.95/mo −50%
Udrul nu
14 dages pengene-tilbage-garanti
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Dedikeret IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

Små LLMer · 7B parametre

$7.475 /mo
$14.95/mo −50%
Udrul nu
14 dages pengene-tilbage-garanti
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedikeret IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

13B+ modeller · RAG-stakke

$26.475 /mo
$52.95/mo −50%
Udrul nu
14 dages pengene-tilbage-garanti
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Dedikeret IPv4 + IPv6
  • Root SSH · KVM

Ofte stillede spørgsmål — ChatGPT VPS

Typiske spørgsmål, klare svar.

Kan jeg køre ChatGPT på min egen VPS?

ChatGPT er OpenAIs proprietære tjeneste, men du kan self-hoste open-weight-alternativer som Llama 3, Mistral, Phi eller DeepSeek på din Cloudzy VPS. Værktøjer som Ollama og Open WebUI giver dig en lignende chatoplevelse med fuld kontrol over privatlivet.

Hvor meget RAM har jeg brug for til LLM-inferens?

Det afhænger af modelstørrelsen. En 7B-parametrisk model (som Llama 3 8B kvantiseret) kræver 4-8 GB RAM. En 13B-model kræver 8-16 GB. Større 70B-modeller kræver 32-64 GB. Start med 4 GB-planen til små modeller og skalér op efter behov.

Er GPU nødvendigt for at køre LLMer?

Nej. Værktøjer som llama.cpp og Ollama er optimeret til CPU-inferens på AMD EPYC. Du får færre tokens per sekund sammenlignet med GPU, men til personlig brug, små teams eller asynkrone batchjobs fungerer CPU-inferens fint og koster en brøkdel af GPU-hosting.

Kan jeg hoste flere modeller på én gang?

Ja. Med tilstrækkelig RAM kan du køre flere modeller via Ollama eller vLLM og skifte imellem dem. Hver model indlæses i hukommelsen efter behov. En 16 GB-plan kan uden problemer betjene 2-3 små modeller samtidigt.

Hvad med datasikkerhed?

Alt forbliver på din VPS. Ingen data sendes til tredjeparts APIer. Du styrer modellen, dataene og netværket. Det er den primære fordel frem for hostede AI-tjenester: dine prompts og svar forlader aldrig din server.

Hvordan installerer jeg Ollama?

Én kommando: curl -fsSL https://ollama.ai/install.sh | sh. Hent derefter en model med ollama pull llama3 og gå i gang. Hele processen tager under 5 minutter på en frisk VPS.

Kan jeg eksponere min LLM som en API?

Ja. Ollama stiller som standard en OpenAI-kompatibel API til rådighed på port 11434. vLLM eksponerer også et OpenAI-kompatibelt endpoint. Peg din app, bot eller frontend mod din VPS IP og port.

Hvad er oppetidsgarantien?

Cloudzy tilbyder en oppetidsgaranti på 99,95% på tværs af alle planer. Din AI-server kører døgnet rundt med redundante netværksstier og 40 Gbps-forbindelse.

Kan jeg finjustere modeller på denne VPS?

CPU fine-tuning er muligt, men langsomt. Til LoRA/QLoRA fine-tuning af små modeller (7B) fungerer en CPU-plan med høj RAM fint til eksperimenter. Til produktions-fine-tuning af store modeller er GPU-instanser det mere praktiske valg.

Hvad er politikken for tilbagebetaling?

14 dages pengene-tilbage-garanti, ingen spørgsmål stillet. Test dit AI-setup, mål inferenshastighed, træf din beslutning. Fuld refusion via dashboardet eller supporten.

Klar når du er.
AI-server på 60 sekunder.

Intet kreditkort krævet · 14 dages pengene-tilbage-garanti · Opsig når du vil