50% korting alle abonnementen, tijdelijk aanbod. Vanaf $2.48/mo

ChatGPT VPS Hosting

Je eigen AI-server,
jouw eigen regels.

Host open-weight LLMs en AI APIs zelf op AMD EPYC met NVMe opslag.
Onafhankelijke cloud sinds 2008, geen vendor lock-in, geen gebruikslimieten.
Vertrouwd door 122,000+ gebruikers · van $2.48/mo.

4.6 · 721 reviews on Trustpilot

Vanaf $2.48/mo · 50% korting · Geen creditcard vereist

~ ssh root@ai-001 verbonden
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Ollama installeren...
Ollama succesvol geïnstalleerd.
root@ai-001:~# ollama pull llama3
model llama3 wordt opgehaald... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS in één oogopslag

Cloudzy biedt ChatGPT VPS hosting voor het zelf hosten van LLMs en AI-inferentie via 12 regio's, beginnend bij $2.48/mo. Elk abonnement draait op AMD EPYC met DDR5 geheugen, NVMe opslag, en 40 Gbps uplinks. Installeer Ollama, llama.cpp, vLLM, of je eigen inferentiestack, volledige root-toegang, geen API-snelheidslimieten. Provisioning in 60 secondenOnafhankelijk sinds 2008, beoordeeld 4.6/5 by 679+ beoordelaars op Trustpilot.

Startprijs
$2.48 / month
CPU
AMD EPYC · DDR5
Inrichting
60 seconden
Regio's
12 wereldwijd
Geld terug
14 dagen
Opgericht
2008

Waarom developers kiezen voor Cloudzy

Een tech-savvy favoriete

De vier punten waarop kopers ons vergelijken, goed aangepakt.

Krachtige infrastructuur

Nieuwste AMD EPYC, uitsluitend NVMe-opslag, DDR5-geheugen, 40 Gbps uplinks. Topprestaties per core in elk plan.

Risicovrije proefperiode

14 dagen niet-goed-geld-terug garantie op elk plan. Geen vragen gesteld. Geen installatiekosten. Annuleer op elk moment via het dashboard.

99.95% beschikbaarheids-SLA

Geautomatiseerde monitoring in 12 regio's. Onze SLA van de afgelopen 30 dagen is publiek zichtbaar op status.cloudzy.com, niets wordt verborgen.

24/7 menselijke ondersteuning

Live chat en ticketreacties doorgaans binnen 5 minuten. Technici, geen scriptlezers. Mediane oplostijd onder 1 uur.

AI-tools die je zelf kunt hosten

Open-weight modellen, uw infrastructuur.

Draai elk open-weight model of AI-framework. Volledige root-toegang betekent dat jij de stack, het model en de serving-laag kiest. Geen API-sleutels van derde partijen nodig.

Ollama
Één-commando LLM-service
llama.cpp
CPU-geoptimeerde inferentie
vLLM
Hoge-doorvoer serving
Open WebUI
Chatinterface voor LLMs
LangChain
Orchestratieringsframework
Hugging Face
Model hub + Transformers

Gebruiksscenario's

Waarom ontwikkelaars kiezen voor
Cloudzy's ChatGPT VPS.

Privé ChatGPT-alternatief

Draai Llama 3, Mistral of Phi op je eigen server met Open WebUI. Chatinterface, gespreksgeschiedenis, geen data verlaat je VPS.

API-backend voor je app

Serveer een LLM achter je eigen REST API. Geen kosten per token, geen limieten. Koppel het aan je SaaS, bot of intern tool.

Fine-tuning en experimenten

Upload datasets, fine-tune LoRA adapters, voer evaluaties uit. Persistente NVMe-opslag zorgt dat je checkpoints herstarts overleven.

RAG-pipeline server

Combineer een lokale LLM met een vector-DB (Chroma, Qdrant, Weaviate) voor retrieval-augmented generation. Alles op één machine.

Vergelijking van meerdere modellen

Draai Llama, Mistral en Phi naast elkaar. Vergelijk output, latency en kwaliteit voordat je één model in productie kiest.

AI-codeeringsassistent

Self-host Code Llama of DeepSeek Coder en koppel het via een lokale API aan je IDE. Automatisch aanvullen en chatten zonder code extern te versturen.

60s
Inrichting
40 Gbps
Opwaartse verbinding
Alleen NVMe
Opslag
12
Regio's
99.95%
Bedrijfstijd SLA
14 dagen
Geld terug

Globaal netwerk

12 regio's. Vier continenten.
Één klik verwijderd.

Zet je ChatGPT VPS zo dicht mogelijk bij je gebruikers. Mediane P50-latency onder de 10 ms in Noord-Amerika en Europa.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Prijzen

Betaal voor wat je gebruikt. Dat is het.

Per uur, maand of jaar. Geen bandbreedtekosten. Geen verplichtingen. Momenteel 50% korting alle plannen.

512 MB DDR5

Kleine modellen · testen

$2.48 /maand
$4.95/mo −50%
Implementeer nu
14 dagen geld-terug-garantie
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

Kleine LLMs · 7B params

$7.475 /maand
$14.95/mo −50%
Implementeer nu
14 dagen geld-terug-garantie
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

13B+ modellen · RAG-stacks

$26.475 /maand
$52.95/mo −50%
Implementeer nu
14 dagen geld-terug-garantie
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM

Veelgestelde vragen — ChatGPT VPS

Veelgestelde vragen duidelijke antwoorden.

Kan ik ChatGPT op mijn eigen VPS draaien?

ChatGPT zelf is een gesloten dienst van OpenAI, maar je kunt open alternatieven zoals Llama 3, Mistral, Phi of DeepSeek zelf hosten op je Cloudzy VPS. Tools als Ollama en Open WebUI geven je een vergelijkbare chatervaring met volledige privacy.

Hoeveel RAM heb ik nodig voor LLM-inferentie?

Dat hangt af van de modelgrootte. Een model met 7B parameters (zoals Llama 3 8B gekwantiseerd) draait op 4-8 GB RAM. Een 13B-model heeft 8-16 GB nodig. Grotere 70B-modellen vereisen 32-64 GB. Begin met het 4 GB-plan voor kleine modellen en schaal op naar behoefte.

Is GPU vereist om LLMs te draaien?

Nee. Tools zoals llama.cpp en Ollama zijn geoptimaliseerd voor CPU-inferentie op AMD EPYC. Je krijgt minder tokens per seconde dan met GPU, maar voor persoonlijk gebruik, kleine teams of asynchrone batchtaken werkt CPU-inferentie prima en kost het een fractie van GPU-hosting.

Kan ik meerdere modellen tegelijk hosten?

Ja. Met voldoende RAM kun je meerdere modellen draaien via Ollama of vLLM en er tussen wisselen. Elk model wordt op aanvraag in het geheugen geladen. Een 16 GB-plan kan comfortabel 2-3 kleine modellen tegelijkertijd bedienen.

Hoe zit het met dataprivacy?

Alles blijft op je eigen VPS. Er worden geen gegevens naar externe APIs gestuurd. Jij bepaalt het model, de data en het netwerk. Dit is het grote voordeel ten opzichte van gehoste AI-diensten: je prompts en antwoorden verlaten nooit je server.

Hoe installeer ik Ollama?

Één commando: curl -fsSL https://ollama.ai/install.sh | sh. Haal daarna een model op met ollama pull llama3 en begin direct. Het hele proces duurt minder dan 5 minuten op een verse VPS.

Kan ik mijn LLM als een API beschikbaar stellen?

Ja. Ollama biedt standaard een OpenAI-compatibele API op poort 11434. vLLM stelt ook een OpenAI-compatibel endpoint beschikbaar. Verwijs je app, bot of frontend naar het IP-adres en de poort van je VPS.

Wat is de uptime-garantie?

Cloudzy biedt een uptime-garantie van 99,95% voor alle plannen. Je AI-server blijft dag en nacht online dankzij redundante netwerkpaden en 40 Gbps-connectiviteit.

Kan ik modellen fine-tunen op deze VPS?

CPU fine-tuning is mogelijk, maar traag. Voor LoRA/QLoRA fine-tuning van kleine modellen (7B) is een CPU-plan met veel RAM geschikt voor experimenten. Voor productie-fine-tuning van grote modellen zijn GPU-instanties praktischer.

Wat is het restitutiebeleid?

14 dagen niet-goed-geld-terug-garantie, geen vragen gesteld. Test je AI-omgeving, meet de inferentiesnelheid, en beslis. Volledige terugbetaling via het dashboard of via support.

Klaar als jij het bent.
AI-server in 60 seconden.

Geen creditcard vereist · 14 dagen geld-terug-garantie · Op elk moment opzegbaar