50% rabat alle planer, begrænset periode. Fra kun $2.48/mo

ChatGPT VPS-hosting

Din egen AI-server,
dine egne regler.

Self-host open-weight LLMs og AI APIs på AMD EPYC med NVMe lagring.
Uafhængig cloud siden 2008, ingen vendor lock-in, ingen forbrugsbegrænsninger.
Betroet af 122,000+ brugere · fra $2.48/mo.

4.6 · 721 reviews on Trustpilot

Starter ved $2.48/mo · 50% rabat · Intet kreditkort kræves

~ ssh root@ai-001 forbundet
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Installerer Ollama...
Ollama blev installeret.
root@ai-001:~# ollama pull llama3
henter model llama3... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS i overblik

Cloudzy tilbyder ChatGPT VPS hosting til self-hosting af LLMs og AI-inferens på tværs af 12 regioner, starter ved $2.48/mo. Alle planer kører på AMD EPYC med DDR5 hukommelse, NVMe lagerplads og 40 Gbps uplinks. Installer Ollama, llama.cpp, vLLM eller din egen inferensstak, fuld root-adgang, ingen API-hastighedsbegrænsninger. Klar på 60 sekunder. Uafhængig siden 2008, bedømt 4.6/5 by 679+ anmeldere på Trustpilot.

Startpris
$2.48 / month
CPU
AMD EPYC · DDR5
Klargøring
60 sekunder
Regioner
12 verden over
Penge-tilbage
14 dage
Grundlagt
2008

Derfor vælger udviklere Cloudzy

En tech-kyndig favorit

De fire ting, kunder reelt sammenligner os på - her leverer vi.

Højtydende infrastruktur

Nyeste generation af AMD EPYC, udelukkende NVMe-lager, DDR5-hukommelse, 40 Gbps uplinks. Stærk enkelt-tråds-ydelse på alle planniveauer.

Prøv uden risiko

14-dages pengene-tilbage-garanti på alle planer. Ingen spørgsmål. Ingen oprettelsesgebyrer. Annuller når som helst fra dashboardet.

99,95% driftid SLA

Automatisk overvågning på tværs af 12 regioner. Vores SLA for de seneste 30 dage er offentligt tilgængeligt på status.cloudzy.com, uden skjulte tal.

24/7 menneskelig support

Live chat og ticket-svar typisk under 5 minutter. Ingeniører, ikke manuskriptlæsere. Median løsningstid under 1 time.

AI-værktøjer du kan self-hoste

Open-weight-modeller, din infrastruktur.

Kør enhver open-weight-model eller AI-framework. Fuld root-adgang betyder, at du selv vælger stak, model og serveringslag. Ingen API-nøgler fra tredjeparter krævet.

Ollama
LLM-servering med én kommando
llama.cpp
CPU-optimeret inferens
vLLM
Servering med høj gennemstrømning
Åbn WebUI
Chatgrænseflade til LLMs
LangChain
Orkestreringsramme
Hugging Face
Model-hub + Transformers

Brugssituationer

Derfor vælger udviklere
Cloudzys ChatGPT VPS.

Privat ChatGPT-alternativ

Kør Llama 3, Mistral eller Phi på din egen server med Open WebUI. Chatgrænseflade, samtalehistorik, ingen data forlader dit VPS.

API-backend til din app

Server en LLM bag dit eget REST API. Ingen fakturering per token, ingen hastighedsbegrænsninger. Integrer med din SaaS, bot eller interne værktøj.

Finjustering og eksperimenter

Upload datasæt, finjuster LoRA-adaptere, kør evalueringer. Vedvarende NVMe-lager betyder, at dine checkpoints overlever genstarter.

RAG-pipeline-server

Kombiner en lokal LLM med en vektor-DB (Chroma, Qdrant, Weaviate) til retrieval-augmented generation. Alt på én server.

Multi-model sammenligning

Kør Llama, Mistral og Phi side om side. Sammenlign output, latenstid og kvalitet, inden du vælger én model til produktion.

AI-kodningsassistent

Self-host Code Llama eller DeepSeek Coder og forbind det til dit IDE via en lokal API. Auto-complete og chat uden at sende kode eksternt.

60s
Klargøring
40 Gbps
Oplink
NVMe-kun
Lagring
12
Regioner
99.95%
Oppetid SLA
14 dage
Penge-tilbage

Globalt netværk

12 regioner. Fire kontinenter.
Ét klik væk.

Placér din ChatGPT VPS så tæt på dine brugere, som fysikken tillader. Median P50-latenstid under 10 ms i Nordamerika og Europa.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Priser

Betal kun for det, du bruger. Det er det.

Pr. time, måned eller år. Ingen overførselsgebyrer. Ingen binding. Aktuelt 50% rabat alle planer.

512 MB DDR5

Små modeller · test

$2.48 /md
$4.95/mo −50%
Implementer nu
14 dages pengene-tilbage-garanti
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Dedikeret IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

Små LLMer · 7B parametre

$7.475 /md
$14.95/mo −50%
Implementer nu
14 dages pengene-tilbage-garanti
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedikeret IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

13B+ modeller · RAG-stakke

$26.475 /md
$52.95/mo −50%
Implementer nu
14 dages pengene-tilbage-garanti
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Dedikeret IPv4 + IPv6
  • Root SSH · KVM

Ofte stillede spørgsmål — ChatGPT VPS

Almindelige spørgsmål, Direkte svar.

Kan jeg køre ChatGPT på min egen VPS?

ChatGPT er OpenAIs proprietære tjeneste, men du kan self-hoste open-weight-alternativer som Llama 3, Mistral, Phi eller DeepSeek på din Cloudzy VPS. Værktøjer som Ollama og Open WebUI giver dig en lignende chatoplevelse med fuld kontrol over privatlivet.

Hvor meget RAM har jeg brug for til LLM-inferens?

Det afhænger af modelstørrelsen. En 7B-parametrisk model (som Llama 3 8B kvantiseret) kræver 4-8 GB RAM. En 13B-model kræver 8-16 GB. Større 70B-modeller kræver 32-64 GB. Start med 4 GB-planen til små modeller og skalér op efter behov.

Er GPU nødvendigt for at køre LLMer?

Nej. Værktøjer som llama.cpp og Ollama er optimeret til CPU-inferens på AMD EPYC. Du får færre tokens per sekund sammenlignet med GPU, men til personlig brug, små teams eller asynkrone batchjobs fungerer CPU-inferens fint og koster en brøkdel af GPU-hosting.

Kan jeg hoste flere modeller på én gang?

Ja. Med tilstrækkelig RAM kan du køre flere modeller via Ollama eller vLLM og skifte imellem dem. Hver model indlæses i hukommelsen efter behov. En 16 GB-plan kan uden problemer betjene 2-3 små modeller samtidigt.

Hvad med datasikkerhed?

Alt forbliver på din VPS. Ingen data sendes til tredjeparts APIer. Du styrer modellen, dataene og netværket. Det er den primære fordel frem for hostede AI-tjenester: dine prompts og svar forlader aldrig din server.

Hvordan installerer jeg Ollama?

Én kommando: curl -fsSL https://ollama.ai/install.sh | sh. Hent derefter en model med ollama pull llama3 og gå i gang. Hele processen tager under 5 minutter på en frisk VPS.

Kan jeg eksponere min LLM som en API?

Ja. Ollama stiller som standard en OpenAI-kompatibel API til rådighed på port 11434. vLLM eksponerer også et OpenAI-kompatibelt endpoint. Peg din app, bot eller frontend mod din VPS IP og port.

Hvad er oppetidsgarantien?

Cloudzy tilbyder en oppetidsgaranti på 99,95% på tværs af alle planer. Din AI-server kører døgnet rundt med redundante netværksstier og 40 Gbps-forbindelse.

Kan jeg finjustere modeller på denne VPS?

CPU fine-tuning er muligt, men langsomt. Til LoRA/QLoRA fine-tuning af små modeller (7B) fungerer en CPU-plan med høj RAM fint til eksperimenter. Til produktions-fine-tuning af store modeller er GPU-instanser det mere praktiske valg.

Hvad er politikken for tilbagebetaling?

14 dages pengene-tilbage-garanti, ingen spørgsmål stillet. Test dit AI-setup, mål inferenshastighed, træf din beslutning. Fuld refusion via dashboardet eller supporten.

Klar, når du er det.
AI-server på 60 sekunder.

Intet kreditkort kræves · 14 dages pengene-tilbage-garanti · Annuller når som helst