Ga naar hoofdinhoud
50% korting alle plannen, beperkte tijd. Vanaf $2.48/mo

ChatGPT VPS Hosting

Je eigen AI-server,
jouw eigen regels.

Self-host open-weight LLMs and AI APIs on AMD EPYC with NVMe storage.
Independent cloud since 2008, no vendor lock-in, no usage caps.
Trusted by 122,000+ users · from $2.48/mo.

4.7 · 755 reviews on Trustpilot

Vanaf $2.48/mo · 50% korting · Geen creditcard nodig

~ ssh root@ai-001 verbonden
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Installing Ollama...
Ollama installed successfully.
root@ai-001:~# ollama pull llama3
pulling model llama3... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS in één oogopslag

Cloudzy offers ChatGPT VPS hosting for self-hosting LLMs and AI inference across 13 regions, starting at $2.48/mo. Every plan runs on AMD EPYC with DDR5 memory, NVMe storage, and 40 Gbps uplinks. Install Ollama, llama.cpp, vLLM, or your own inference stack, full root access, no API rate limits. Provision in 60 seconds. Independent since 2008, rated 4.7/5 by 700+ reviewers on Trustpilot.

Vanafprijs
$2,48 / maand
CPU
AMD EPYC · DDR5
Inrichting
60 seconden
Regio's
13 wereldwijd
Geld terug
14 dagen
Opgericht
2008

Waarom ontwikkelaars Cloudzy kiezen

Een tech-savvy favoriete

De vier dingen waar kopers ons echt op vergelijken, goed gedaan.

High-spec-infrastructuur

Nieuwste generatie AMD EPYC, alleen NVMe-opslag, DDR5-geheugen, 40 Gbps uplinks. Top-single-thread-prestaties op elk plan.

Risicovrij proberen

14 dagen niet-goed-geld-terug-garantie op elk plan. Zonder vragen. Geen setup-kosten. Op elk moment opzegbaar vanuit het dashboard.

99,95% uptime-SLA

Automatische monitoring in 13 regio's. Onze SLA over de laatste 30 dagen staat openbaar op status.cloudzy.com. Niks om te verbergen.

24/7 menselijke support

Reacties op livechat en tickets meestal binnen 5 minuten. Engineers, geen scriptlezers. Mediane oplostijd onder 1 uur.

AI-tools die je zelf kunt hosten

Open-weight models, your infrastructure.

Draai elk open-weight model of AI-framework. Volledige root-toegang betekent dat jij de stack, het model en de serving-laag kiest. Geen API-sleutels van derde partijen nodig.

Ollama
Één-commando LLM-service
llama.cpp
CPU-geoptimeerde inferentie
vLLM
Hoge-doorvoer serving
Open WebUI
Chatinterface voor LLMs
LangChain
Orchestratieringsframework
Hugging Face
Model hub + Transformers

Use cases

Waarom ontwikkelaars kiezen voor
Cloudzy's ChatGPT VPS.

Privé ChatGPT-alternatief

Draai Llama 3, Mistral of Phi op je eigen server met Open WebUI. Chatinterface, gespreksgeschiedenis, geen data verlaat je VPS.

API-backend voor je app

Serveer een LLM achter je eigen REST API. Geen kosten per token, geen limieten. Koppel het aan je SaaS, bot of intern tool.

Fine-tuning en experimenten

Upload datasets, fine-tune LoRA adapters, voer evaluaties uit. Persistente NVMe-opslag zorgt dat je checkpoints herstarts overleven.

RAG-pipeline server

Combineer een lokale LLM met een vector-DB (Chroma, Qdrant, Weaviate) voor retrieval-augmented generation. Alles op één machine.

Vergelijking van meerdere modellen

Draai Llama, Mistral en Phi naast elkaar. Vergelijk output, latency en kwaliteit voordat je één model in productie kiest.

AI-codeeringsassistent

Self-host Code Llama of DeepSeek Coder en koppel het via een lokale API aan je IDE. Automatisch aanvullen en chatten zonder code extern te versturen.

60s
Inrichting
40 Gbps
Opwaartse verbinding
Alleen NVMe
Opslag
13
Regio's
99.95%
Uptime-SLA
14 days
Geld terug

Wereldwijd netwerk

13 regio's. Vier continenten.
Eén klik verwijderd.

Zet je ChatGPT VPS zo dicht mogelijk bij je gebruikers. Mediane P50-latency onder de 10 ms in Noord-Amerika en Europa.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Prijzen

Betaal alleen wat je gebruikt. Dat is het.

Per uur, per maand of per jaar. Geen egresskosten. Geen verplichtingen. Nu 50% korting alle plannen.

512 MB DDR5

Kleine modellen · testen

$2.48 /mo
$4.95/mo −50%
Nu uitrollen
14 dagen niet-goed-geld-terug
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

Kleine LLMs · 7B params

$7.475 /mo
$14.95/mo −50%
Nu uitrollen
14 dagen niet-goed-geld-terug
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

13B+ modellen · RAG-stacks

$26.475 /mo
$52.95/mo −50%
Nu uitrollen
14 dagen niet-goed-geld-terug
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM

Veelgestelde vragen — ChatGPT VPS

Veelgestelde vragen, directe antwoorden.

Kan ik ChatGPT op mijn eigen VPS draaien?

ChatGPT zelf is een gesloten dienst van OpenAI, maar je kunt open alternatieven zoals Llama 3, Mistral, Phi of DeepSeek zelf hosten op je Cloudzy VPS. Tools als Ollama en Open WebUI geven je een vergelijkbare chatervaring met volledige privacy.

Hoeveel RAM heb ik nodig voor LLM-inferentie?

Dat hangt af van de modelgrootte. Een model met 7B parameters (zoals Llama 3 8B gekwantiseerd) draait op 4-8 GB RAM. Een 13B-model heeft 8-16 GB nodig. Grotere 70B-modellen vereisen 32-64 GB. Begin met het 4 GB-plan voor kleine modellen en schaal op naar behoefte.

Is GPU vereist om LLMs te draaien?

Nee. Tools zoals llama.cpp en Ollama zijn geoptimaliseerd voor CPU-inferentie op AMD EPYC. Je krijgt minder tokens per seconde dan met GPU, maar voor persoonlijk gebruik, kleine teams of asynchrone batchtaken werkt CPU-inferentie prima en kost het een fractie van GPU-hosting.

Kan ik meerdere modellen tegelijk hosten?

Ja. Met voldoende RAM kun je meerdere modellen draaien via Ollama of vLLM en er tussen wisselen. Elk model wordt op aanvraag in het geheugen geladen. Een 16 GB-plan kan comfortabel 2-3 kleine modellen tegelijkertijd bedienen.

Hoe zit het met dataprivacy?

Alles blijft op je eigen VPS. Er worden geen gegevens naar externe APIs gestuurd. Jij bepaalt het model, de data en het netwerk. Dit is het grote voordeel ten opzichte van gehoste AI-diensten: je prompts en antwoorden verlaten nooit je server.

Hoe installeer ik Ollama?

Één commando: curl -fsSL https://ollama.ai/install.sh | sh. Haal daarna een model op met ollama pull llama3 en begin direct. Het hele proces duurt minder dan 5 minuten op een verse VPS.

Kan ik mijn LLM als een API beschikbaar stellen?

Ja. Ollama biedt standaard een OpenAI-compatibele API op poort 11434. vLLM stelt ook een OpenAI-compatibel endpoint beschikbaar. Verwijs je app, bot of frontend naar het IP-adres en de poort van je VPS.

Wat is de uptime-garantie?

Cloudzy biedt een uptime-garantie van 99,95% voor alle plannen. Je AI-server blijft dag en nacht online dankzij redundante netwerkpaden en 40 Gbps-connectiviteit.

Kan ik modellen fine-tunen op deze VPS?

CPU fine-tuning is mogelijk, maar traag. Voor LoRA/QLoRA fine-tuning van kleine modellen (7B) is een CPU-plan met veel RAM geschikt voor experimenten. Voor productie-fine-tuning van grote modellen zijn GPU-instanties praktischer.

Wat is het restitutiebeleid?

14 dagen niet-goed-geld-terug-garantie, geen vragen gesteld. Test je AI-omgeving, meet de inferentiesnelheid, en beslis. Volledige terugbetaling via het dashboard of via support.

Klaar wanneer jij het bent.
AI-server in 60 seconden.

Geen creditcard nodig · 14 dagen niet-goed-geld-terug · altijd opzegbaar