What is an Ollama VPS?

An Ollama VPS is a Cloudzy cloud server set up to run Ollama, the local LLM runtime. Pull open-source models like Llama 3, Mistral, Qwen, DeepSeek, or Gemma; serve them behind your own OpenAI-compatible API; build chat apps, agents, and tools without sending traffic to a third-party model provider.

Is Ollama pre-installed?

Ollama is available as a one-click install from the panel. Pick a Linux template, the binary lands on your PATH, and `ollama pull llama3` works within a minute. The HTTP API listens on port 11434 by default; bind it to your dedicated IP behind a reverse proxy.

Can I run LLMs on a CPU-only VPS?

Yes, for smaller models. Llama 3 8B and Mistral 7B run on a 16 GB CPU box, Qwen 0.5B–3B and Gemma 2B run comfortably on 4 GB. Throughput depends on the size of the model and the prompt; CPU is slower than GPU but fine for low-volume APIs, side projects, and dev work.

Do you offer GPU plans for larger models?

Yes. For 70B-class models or high-throughput inference, see our GPU plans (RTX 4090, RTX 5090, A100). The 4090 handles Llama 3 70B with quantization; A100 80GB runs full-precision big models. Linked from the pricing page.

Is the OpenAI-compatible API supported?

Yes. Ollama exposes a `/v1/chat/completions` endpoint that's drop-in compatible with the OpenAI client. Point your existing app at `http://your-vps:11434/v1` and switch the model name. Same SDK, no rewrite.

How much disk does a model take?

It depends. A 4-bit quantized 7B model is around 4 GB. An 8B is around 5 GB. A 70B at 4-bit is ~40 GB. Pull as many as you have room for. Plans start at 60 GB NVMe and go to 1.5 TB; mix and match models on one box.

How fast is provisioning?

Once payment is confirmed, your VPS is live in 60 seconds. With Ollama's one-click installed, the runtime is up in another minute. The first model pull takes longer (network-bound) but subsequent ones are warm-cached on NVMe.

Do I get a dedicated IP?

Yes, every VPS comes with a dedicated static IPv4 plus IPv6. Reach the Ollama API over the dedicated IP, slap a Caddy reverse proxy in front for HTTPS on a real hostname, and you're done. Floating IPs are available.

Are there hidden fees?

No. Egress is included in your monthly transfer allotment. Snapshots are free. IPv4 + IPv6 are included. Root access is included. The only paid extras are Floating IPs ($2.50/month) and additional snapshots beyond the free quota.

Is there a money-back guarantee?

Yes, 14 days from purchase, no questions asked, full refund. Apply from the panel or email support@cloudzy.com.

Ollama VPS-hosting

Kør open-source
LLMs på din VPS.

Name: Cloudzy Ollama VPS
Brand: Cloudzy
Availability: InStock
Rating: 4.6 (735 reviews)

Ollama-klar VPS på den nyeste AMD EPYC og ren NVMe.
Uafhængig siden 2008. Lama, Mistral, Qwen, DeepSeek, Gemma، همه زیر IP شما.

4.6· 735 reviews on Trustpilot

Deploy en Ollama VPS Sammenlign planer

Starter ved $2.48/mo · 50% rabat · Intet kreditkort kræves

~ ssh root@ollama-lon-001forbundet

root@ollama-lon-001:~# ollama pull llama3
henter manifest... henter model 5,0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "Hvad er en VPS?"
En VPS, eller Virtual Private Server, er en virtualiseret
computermiljø med sit eget styresystem og dedikerede
ressourcer, hostet i skyen...
root@ollama-lon-001:~# _

Ollama VPS på et øjeblik

Cloudzy hoster Ollama-klar VPS fra 12 regioner i Nordamerika, Europa, Mellemøsten og Asien, fra $2.48 per month. Planer fra 512 MB to 64 GB DDR5, alle på NVMe-lagring med 40 Gbps uplinks. Ollama installeres med ét klik; træk Llama 3, Mistral, Qwen, DeepSeek, Gemma og server dem bag en OpenAI-kompatibel APIServere udrulles på 60 sekunder. Cloudzy har kørt uafhængigt siden 2008 og er bedømt 4.6 / 5 by 735+ reviewers på Trustpilot.

Startpris: $2.48 / month
Klargøring: 60 sekunder
Regioner: 12 verden over
Oppetid SLA: 99.95%
Penge-tilbage: 14 dage
Grundlagt: 2008

Derfor vælger udviklere Cloudzy

En LLM-vært favorit

De fire ting, kunder reelt sammenligner os på - her leverer vi.

Optimeret til inferens

AMD EPYC, udelukkende NVMe-lagring, DDR5-hukommelse, 40 Gbps oplink-forbindelser. Modelvægte indlæses fra NVMe på sekunder; ingen langsom disk, der begrænser dit første svar.

Prøv uden risiko

14 dages pengene-tilbage-garanti på alle planer. Ingen spørgsmål stillet. Ingen opstartsgebyrer. Afmeld fra dashboardet når som helst.

99,95% driftid SLA

Automatiseret overvågning i 12 regioner. SLA for de seneste 30 dage spores offentligt på status.cloudzy.com, uden skjul bag PR.

24/7 menneskelig support

Live chat og ticket-svar typisk under 5 minutter. Ingeniører, ikke manuskriptlæsere. Median løsningstid under 1 time.

Vælg din model

Open-weight modeller.
Én kommando væk.

Llama 3 til det sikre valg, Mistral til generel chat, Qwen til flersproget brug, DeepSeek til kode, Gemma til lille CPU-arbejde. Kombiner dem frit, alle på samme NVMe.

Tilpasset GGUF-upload understøttes på alle planer

Llama 3

8B / 70B / 405B

Mistral

7B / Mixtral 8x7B

Qwen

0,5B – 72B Alibaba

DeepSeek

Coder / Chat / R1

Gemma

2B / 7B Google

Phi

Microsofts små modeller

Brugssituationer

Derfor vælger udviklere
Cloudzy's Ollama VPS.

Privat API til din app

OpenAI-kompatibelt endpoint på din dedikerede IP – klar til brug med det samme. Byg chatfunktioner, opsummeringsværktøjer eller agenter uden at sende brugerforespørgsler til en tredjepart.

Baggrundsagenter

Agenter der kører i timevis og batch-behandler e-mails, scraper hjemmesider eller auto-tagger tickets passer ikke til forbrugsbaserede APIs. En fast-pris VPS gør. Sæt et cron-job op, kald Ollama, lad det køre, gentag.

Kodeassistenter

Kør DeepSeek-Coder eller Qwen-Coder bag din editors Continue / Tabby-plugin. Hurtig autofuldførelse, ingen pris pr. forslag, ingen kode sendt til tredjeparter.

Hobby-chat og RAG-demoer

Hent en model, sæt Open WebUI eller LibreChat op, del et link med dine venner. Hele stacken på én VPS for prisen af et par kaffer om måneden.

Compliance-venlige LLMs

Følsomme data (juridiske dokumenter, sundhedsoplysninger, interne filer) forbliver på din VPS. Styr adgangen med iptables og journald – din model, din perimeter.

Træn dine egne fine-tuned modeller

Hent basisvægte, finjuster på en GPU maskine, og send GGUF-filen tilbage til en CPU Ollama VPS til inferens. Billig hverdagsdrift, og brug kun pengene når du træner.

60s

Klargøring

40 Gbps

Oplink

NVMe-kun

Lagring

Regioner

99.95%

Oppetid SLA

14 dage

Penge-tilbage

Globalt netværk

12 regioner. Fire kontinenter.
Vælg din, træk en model.

Placer din inference-server tæt på dine brugere. Median P50-latens under 10 ms i Nordamerika og Europa.

Se alle 12 regioner

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

Priser

Betal kun for det, du bruger. Det er det.

Pr. time, måned eller år. Ingen overførselsgebyrer. Ingen binding. Aktuelt 50% rabat alle planer.

1 GB DDR5

Tiny CPU-modeller · 1B–3B

$3.48/md

$6.95/mo−50%

Implementer nu

14 dages pengene-tilbage-garanti

1 vCPU @ EPYC
25 GB NVMe
1 TB · 40 Gbps
Dedikeret IPv4 + IPv6
Et-klik Ollama

2 GB DDR5

7B / 8B på CPU

$7.475/md

$14.95/mo−50%

Implementer nu

14 dages pengene-tilbage-garanti

1 vCPU @ EPYC
60 GB NVMe
3 TB · 40 Gbps
Dedikeret IPv4 + IPv6
Et-klik Ollama

Mest populær

4 GB DDR5

Mellemstor CPU inferens

$14.47/md

$28.95/mo−50%

Implementer nu

14 dages pengene-tilbage-garanti

2 vCPU @ EPYC
120 GB NVMe
5 TB · 40 Gbps
Dedikeret IPv4 + IPv6
Et-klik Ollama

Mest populær

8 GB DDR5

Større kontekst · API host

$26.475/md

$52.95/mo−50%

Implementer nu

14 dages pengene-tilbage-garanti

4 vCPU @ EPYC
240 GB NVMe
7 TB · 40 Gbps
Dedikeret IPv4 + IPv6
Et-klik Ollama

Har du brug for mere? Se alle 10 planer (op til 64 GB)

Ofte stillede spørgsmål. Ollama VPS

Almindelige spørgsmål, Direkte svar.

Hvad er en Ollama VPS?

En Ollama VPS er en Cloudzy cloud-server konfigureret til at køre Ollama, den lokale LLM-runtime. Hent open source-modeller som Llama 3, Mistral, Qwen, DeepSeek eller Gemma; server dem bag din egen OpenAI-kompatible API; byg chatapps, agenter og værktøjer uden at sende trafik til en tredjeparts modeludbyder.

Er Ollama forudinstalleret?

Ollama kan installeres med ét klik fra panelet. Vælg en Linux-skabelon, binæren tilføjes til din PATH, og `ollama pull llama3` virker inden for et minut. HTTP API lytter som standard på port 11434; bind den til din dedikerede IP bag en reverse proxy.

Kan jeg køre LLMs på en CPU-only VPS?

Ja, til mindre modeller. Llama 3 8B og Mistral 7B kører på en 16 GB CPU-server, og Qwen 0.5B-3B og Gemma 2B kører fint på 4 GB. Gennemstrømningen afhænger af modellens størrelse og prompten. CPU er langsommere end GPU, men tilstrækkeligt til lavvolumen APIs, sideprojekter og udviklingsarbejde.

Tilbyder I GPU-planer til større modeller?

Ja. Til 70B-klasse-modeller eller høj-gennemstrømnings-inferens, se vores GPU-planer (RTX 4090, RTX 5090, A100). 4090 håndterer Llama 3 70B med kvantisering; A100 80 GB kører store modeller i fuld præcision. Linkes fra prissiden.

Er den OpenAI-kompatible API understøttet?

Ja. Ollama eksponerer et `/v1/chat/completions`-endpoint, der er drop-in-kompatibelt med OpenAI-klienten. Peg din eksisterende app på `http://your-vps:11434/v1` og skift modelnavnet. Samme SDK, ingen omskrivning.

Hvor meget diskplads fylder en model?

Det afhænger af modellen. En 4-bit kvantiseret 7B-model fylder ca. 4 GB. En 8B fylder ca. 5 GB. En 70B ved 4-bit fylder ca. 40 GB. Hent så mange som du har plads til. Planer starter ved 60 GB NVMe og går op til 1,5 TB - bland og match modeller på én server.

Hvor hurtigt er klargøringen?

Når betalingen er bekræftet, er din VPS klar på 60 sekunder. Med Ollama installeret via ét klik er runtimen oppe et minut efter. Den første model-download tager lidt længere (netværksbegrænset), men efterfølgende downloads er varm-cachet på NVMe.

Får jeg en dedikeret IP?

Ja, alle VPSs leveres med en dedikeret statisk IPv4 samt IPv6. Tilgå Ollama API via den dedikerede IP, sæt en Caddy reverse proxy foran for HTTPS på et rigtigt hostnavn, og du er klar. Floating IPs er tilgængelige.

Er der skjulte gebyrer?

Nej. Udgående trafik er inkluderet i din månedlige datakvote. Snapshots er gratis. IPv4 + IPv6 er inkluderet. Root-adgang er inkluderet. De eneste betalte tilvalg er Floating IPs (2,50 $/måned) og ekstra snapshots ud over den gratis kvote.

Er der en pengene-tilbage-garanti?

Ja, 14 dage fra købet, ingen spørgsmål, fuld refusion. Ansøg via kontrolpanelet eller send en e-mail til [email protected].

Klar, når du er det.
ollama run, på 60 sekunder.

Vælg en region, klik, hent en model. Din private LLM, din dedikerede IP.

Deploy en Ollama VPS Sammenlign alle planer

Intet kreditkort kræves · 14 dages pengene-tilbage-garanti · Annuller når som helst

Kør open-sourceLLMs på din VPS.

En LLM-vært favorit

Optimeret til inferens

Prøv uden risiko

99,95% driftid SLA

24/7 menneskelig support

Open-weight modeller.Én kommando væk.

Derfor vælger udviklereCloudzy's Ollama VPS.

Privat API til din app

Baggrundsagenter

Kodeassistenter

Hobby-chat og RAG-demoer

Compliance-venlige LLMs

Træn dine egne fine-tuned modeller

12 regioner. Fire kontinenter.Vælg din, træk en model.

Betal kun for det, du bruger. Det er det.

Almindelige spørgsmål, Direkte svar.

Hvad er en Ollama VPS?

Er Ollama forudinstalleret?

Kan jeg køre LLMs på en CPU-only VPS?

Tilbyder I GPU-planer til større modeller?

Er den OpenAI-kompatible API understøttet?

Hvor meget diskplads fylder en model?

Hvor hurtigt er klargøringen?

Får jeg en dedikeret IP?

Er der skjulte gebyrer?

Er der en pengene-tilbage-garanti?

Klar, når du er det.ollama run, på 60 sekunder.

Kør open-source
LLMs på din VPS.

Open-weight modeller.
Én kommando væk.

Derfor vælger udviklere
Cloudzy's Ollama VPS.

12 regioner. Fire kontinenter.
Vælg din, træk en model.

Klar, når du er det.
ollama run, på 60 sekunder.