50% korting alle plannen, beperkte tijd. Vanaf $2.48/mo

ChatGPT VPS-hosting

Uw eigen AI-server,
je eigen regels.

Zelf-host open-weight LLM's en AI API's ingeschakeld AMD EPYC met NVMe opslag.
Onafhankelijke cloud sinds 2008, geen leverancierlock-in, geen gebruikslimieten.
Vertrouwd door 122,000+ gebruikers · van $2.48/mo.

4.6 · 705 beoordelingen op Trustpilot

Vanaf $2.48/mo · 50% korting · geen creditcard nodig

~ ssh root@ai-001 aangesloten
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sch
Ollama installeren...
Ollama is succesvol geïnstalleerd.
root@ai-001:~# ollama trek lama3
trekkend model lama3... 100%
root@ai-001:~# ollama serveren &
Luisteren op 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS in één oogopslag

Cloudzy aanbiedingen ChatGPT VPS hosting voor zelf-hostende LLM's en AI-gevolgtrekking overal 12 regio's, vanaf $2.48/mo. Elk plan gaat door AMD EPYC met DDR5 geheugen, NVMe opslag, en 40 Gbps uplinks. Installeer Ollama, llama.cpp, vLLM of uw eigen inferentiestapel, volledige roottoegang, geen API-snelheidslimieten. Voorziening in 60 seconden. Onafhankelijk sinds 2008, beoordeeld 4.6/5 by 679+ recensenten op Trustpilot.

Vanafprijs
$2,48 / maand
CPU
AMD EPYC · DDR5
Voorzieningen
60 seconden
Regio's
12 wereldwijd
Geld terug
14 dagen
Opgericht
2008

Waarom ontwikkelaars Cloudzy kiezen

Een tech-savvy favoriet.

De vier dingen waar kopers ons echt op vergelijken, goed gedaan.

High-spec-infrastructuur

Nieuwste generatie AMD EPYC, alleen NVMe-opslag, DDR5-geheugen, 40 Gbps uplinks. Top-single-thread-prestaties op elk plan.

Risicovrij proberen

14 dagen niet-goed-geld-terug-garantie op elk plan. Zonder vragen. Geen setup-kosten. Op elk moment opzegbaar vanuit het dashboard.

99,95% uptime-SLA

Automatische monitoring in 12 regio's. Onze SLA over de laatste 30 dagen staat openbaar op status.cloudzy.com. Niks om te verbergen.

24/7 menselijke support

Reacties op livechat en tickets meestal binnen 5 minuten. Engineers, geen scriptlezers. Mediane oplostijd onder 1 uur.

AI-tools die u zelf kunt hosten

Modellen met open gewicht, uw infrastructuur.

Voer elk open-weight-model of AI-framework uit. Volledige root betekent dat u de stapel, het model en de serveerlaag kiest. Geen API-sleutels van derden nodig.

Ollama
LLM-bediening met één opdracht
llama.cpp
CPU-geoptimaliseerde gevolgtrekking
vLLM
Serveren met hoge doorvoer
Open WebUI
Chatinterface voor LLM's
LangChain
Orkestratie raamwerk
Knuffelend gezicht
Modelhub + Transformers

Use cases

Waarom ontwikkelaars kiezen voor
Cloudzy's ChatGPT VPS.

PrivéchatGPT-alternatief

Voer Llama 3, Mistral of Phi uit op uw eigen server met Open WebUI. Chatinterface, gespreksgeschiedenis, geen gegevens verlaten uw VPS.

API-backend voor uw app

Serveer een LLM achter uw eigen REST API. Geen facturering per token, geen tarieflimieten. Integreer met uw SaaS, bot of interne tool.

Verfijning en experimenten

Upload datasets, verfijn LoRA-adapters, voer evaluaties uit. Persistente NVMe-opslag betekent dat uw checkpoints het opnieuw opstarten overleven.

RAG-pijplijnserver

Combineer een lokale LLM met een vector-DB (Chroma, Qdrant, Weaviate) voor ophaal-vergrote generatie. Alles op één doos.

Vergelijking van meerdere modellen

Laat Llama, Mistral en Phi zij aan zij rennen. Vergelijk output, latentie en kwaliteit voordat u zich vastlegt op één model in productie.

AI-coderingsassistent

Host Code Llama of DeepSeek Coder zelf en verbind deze met uw IDE via een lokale API. Automatisch aanvullen en chatten zonder code extern te verzenden.

60s
Voorzieningen
40 Gbps
Uplink
Alleen NVMe
Opslag
12
Regio's
99.95%
Uptime-SLA
14 dagen
Geld terug

Wereldwijd netwerk

12 regio's. Vier continenten.
Eén klik verwijderd.

Plaats uw ChatGPT VPS zo dicht bij uw gebruikers als de natuurkunde dit toelaat. Mediane P50-latentie minder dan 10 ms in Noord-Amerika en Europa.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Prijzen

Betaal alleen wat je gebruikt. Dat is het.

Per uur, per maand of per jaar. Geen egresskosten. Geen verplichtingen. Nu 50% korting alle plannen.

512 MB DDR5

Kleine modellen · testen

$2.48 /mnd
$4.95/mo −50%
Nu uitrollen
14 dagen niet-goed-geld-terug
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

Kleine LLM's · 7B params

$7.475 /mnd
$14.95/mo −50%
Nu uitrollen
14 dagen niet-goed-geld-terug
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

13B+ modellen · RAG-stapels

$26.475 /mnd
$52.95/mo −50%
Nu uitrollen
14 dagen niet-goed-geld-terug
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Root SSH · KVM

Veelgestelde vragen — ChatGPT VPS

Veelgestelde vragen, directe antwoorden.

Kan ik ChatGPT op mijn eigen VPS draaien?

ChatGPT zelf is de eigen service van OpenAI, maar u kunt zelf open-weight-alternatieven zoals Llama 3, Mistral, Phi of DeepSeek hosten op uw Cloudzy VPS. Tools zoals Ollama en Open WebUI bieden u een vergelijkbare chatervaring met volledige privacy.

Hoeveel RAM heb ik nodig voor LLM-inferentie?

Het hangt af van de modelgrootte. Een model met 7B-parameters (zoals Llama 3 8B quantized) draait op 4-8 GB RAM. Een 13B-model heeft 8-16 GB nodig. Grotere 70B-modellen hebben 32-64 GB nodig. Begin met het 4 GB-abonnement voor kleine modellen en schaal op.

Is GPU vereist om LLM's uit te voeren?

Nee. Tools zoals llama.cpp en Ollama zijn geoptimaliseerd voor CPU-inferentie op AMD EPYC. Je krijgt langzamere tokens per seconde vergeleken met GPU, maar voor persoonlijk gebruik, kleine teams of asynchrone batchtaken werkt CPU-inferentie prima en kost het een fractie van GPU-hosting.

Kan ik meerdere modellen tegelijk hosten?

Ja. Met voldoende RAM kun je via Ollama of vLLM meerdere modellen draaien en hiertussen schakelen. Elk model wordt op verzoek in het geheugen geladen. Met een abonnement van 16 GB kunnen gemakkelijk 2-3 kleine modellen tegelijk worden bediend.

Hoe zit het met de privacy van gegevens?

Alles blijft op je VPS staan. Er worden geen gegevens verzonden naar API's van derden. U beheert het model, de gegevens en het netwerk. Dit is het belangrijkste voordeel ten opzichte van gehoste AI-services: uw prompts en antwoorden verlaten uw server nooit.

Hoe installeer ik Ollama?

Eén commando: curl -fsSL https://ollama.ai/install.sh | sch. Trek dan een model met ollama, trek llama3 en begin met chatten. Het hele proces duurt minder dan 5 minuten op een nieuwe VPS.

Kan ik mijn LLM als API beschikbaar stellen?

Ja. Ollama heeft standaard een OpenAI-compatibele API op poort 11434. vLLM stelt ook een OpenAI-compatibel eindpunt bloot. Richt uw app, bot of frontend op uw VPS IP en poort.

Wat is de uptime-garantie?

Cloudzy biedt een SLA van 99,95% uptime voor alle abonnementen. Uw AI-server blijft 24 uur per dag online met redundante netwerkpaden en 40 Gbps-connectiviteit.

Kan ik modellen finetunen op deze VPS?

CPU-fijnafstemming is mogelijk, maar traag. Voor LoRA/QLoRA-afstemming van kleine modellen (7B) werkt een CPU-plan met een hoog RAM-geheugen als experiment. Voor het afstemmen van de productie op grote modellen zijn GPU-instanties praktischer.

Wat is het geld-terug-beleid?

14 dagen geld-terug-garantie, geen vragen gesteld. Test uw AI-opstelling, benchmark de inferentiesnelheid, beslis. Volledige terugbetaling via het dashboard of via ondersteuning.

Klaar wanneer jij het bent.
AI-server in 60 seconden.

Geen creditcard nodig · 14 dagen niet-goed-geld-terug · altijd opzegbaar