Ugrás a fő tartalomra
50% kedvezmény minden csomagra, korlátozott ideig. Már $2.48/mo

Ollama VPS Szerverhely

Futtass nyílt forráskódú
LLM-eket a saját VPS-eden.

Ollama-kész VPS a legújabb AMD EPYC-en és tiszta NVMe-n.
Független 2008 óta. Llama, Mistral, Qwen, DeepSeek, Gemma, mind a saját IP-d alatt.

4.7 · 755 reviews on Trustpilot

Kezdő ár $2.48/mo · 50% kedvezmény · Bankkártya nélkül

~ ssh root@ollama-lon-001 csatlakozva
root@ollama-lon-001:~# ollama pull llama3
pulling manifest... pulling model 5.0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "What's a VPS?"
A VPS, or Virtual Private Server, is a virtualized
computing environment with its own OS and dedicated
resources, hosted in the cloud...
root@ollama-lon-001:~# _

Ollama VPS egy pillantásra

Cloudzy üzemeltet Ollama-kész VPS-ek ettől: 13 régió Észak-Amerikában, Európában, Közel-Keleten és Ázsiában, kezdő ár $2.48 per month. A csomagok árai 512 MB to 64 GB DDR5, mind a következőn: NVMe tárhely vele 40 Gbps felfelé irányuló kapcsolatok Ollama installs in one click; pull Llama 3, Mistral, Qwen, DeepSeek, Gemma és kiszolgálhatod őket egy OpenAI-kompatibilis API mögött. Szerverek üzembe helyezése 60 másodperc. Cloudzy has operated independently since 2008 és értékelése 4.7 / 5 by 755+ reviewers a Trustpiloton.

Kezdő ár
$2.48 / month
Kiépítés
60 másodperc
Régiók
13 világszerte
Uptime SLA
99.95%
Pénzvisszafizetés
14 nap
Alapított
2008

Miért választják a fejlesztők a Cloudzy-t

LLM gazda kedvenc

Az a négy dolog, amelyben a vásárlók valóban összehasonlítanak minket, jól megcsinálva.

Inferenciára hangolva

AMD EPYC, kizárólag NVMe alapú tárolás, DDR5 memória, 40 Gbps uplink. A modellsúlyok másodpercek alatt betöltődnek NVMe-ről; semmi lassú lemez nem fojtja el az első választ.

Kockázatmentes próba

14 napos pénzvisszafizetési garancia minden csomagra. Kérdések nélkül. Nincs beállítási díj. Bármikor lemondhatod a vezérlőpultról.

99,95% uptime SLA

Automatizált felügyelet 13 régióban. Az elmúlt 30 nap SLA adata nyilvánosan követhető a status.cloudzy.com oldalon, PR mögé bújás nélkül.

24/7 emberi támogatás

Élő chat és ticket válaszok jellemzően 5 percen belül. Mérnökök, nem szkriptolvasók. Medián megoldás 1 órán belül.

Válassz modellt

Nyílt súlyú modellek.
Egy pull-ra elérhető.

Llama 3 a biztos választáshoz, Mistral általános feladatokhoz, Qwen többnyelvű munkához, DeepSeek kódhoz, Gemma kis CPU feladatokhoz. Kombináld őket szabadon, mind ugyanazon az NVMe-n.

Egyedi GGUF feltöltés minden csomagban elérhető
Llama 3
8B / 70B / 405B
Mistral
7B / Mixtral 8x7B
Qwen
0,5B – 72B Alibaba
DeepSeek
Coder / Chat / R1
Gemma
2B / 7B Google
Phi
Microsoft kis modellek

Felhasználási esetek

Miért választják a fejlesztők
Cloudzy Ollama VPS-ja.

Privát API az alkalmazásodhoz

OpenAI-kompatibilis végpont a dedikált IP-dre telepítve. Építs chat funkciókat, összefoglalókat vagy ágenseket anélkül, hogy felhasználói promptokat küldenél harmadik félhez.

Háttérkiszolgálók

A hosszú futású ágensek, amelyek e-maileket dolgoznak fel kötegesen, oldalakat szkrépelnek, vagy jegyeket címkéznek automatikusan, nem férnek bele a használatalapú árazású API-okba. Egy fix díjas VPS igen. Ütemezz egy feladatot, hívd meg a Ollama-t, várj, ismételd.

Kódassisztensek

Futtatd a DeepSeek-Coder-t vagy a Qwen-Coder-t az editorod Continue / Tabby pluginjének hátterében. Gyors kódkiegészítés, nulla per-suggestion költség, és a kódod nem kerül ki külső szolgáltatóhoz.

Hobbi chat és RAG demók

Tölts le egy modellt, kapcsold össze az Open WebUI-jal vagy a LibreChat-tel, és oszd meg a linket barátokkal. Az egész stack egyetlen VPS-n, havi néhány kávé áráért.

Megfelelőség-barát LLM-ok

Az érzékeny adatok (jogi, egészségügyi, belső dokumentumok) az VPS-den maradnak. Auditáld a hozzáférést iptables-szel és journald-del: a te modelled, a te periméterd.

Készítsd el saját fine-tune-jaidat

Töltsd le az alap súlyokat, finomhangolj egy GPU gépen, majd töltsd vissza a GGUF-ot egy CPU Ollama VPS-re inferenciához. Olcsó hétköznapi kiszolgálás, és csak edzéskor költs többet.

60s
Kiépítés
40 Gbps
Felfelé mutató kapcsolat
Csak NVMe
Tárolás
13
Régiók
99.95%
Uptime SLA
14 days
Pénzvisszafizetés

Globális hálózat

13 régió. Négy kontinens.
Válaszd ki a megfelelőt, tölts le egy modellt.

Helyezd az inferencia-hosztot a felhasználóid közelébe. A P50 medián késleltetés 10 ms alatt van Észak-Amerikában és Európában.

us-utah-1us-dal-1us-lax-1us-lvg-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Árazás

Csak a felhasznált erőforrásokért fizet. Ennyi.

Óránként, havonta vagy évente. Nincs egress díj. Nincs elköteleződés. Jelenleg 50% kedvezmény minden csomag.

1 GB DDR5

Kis CPU modellek · 1B–3B

$3.48 /mo
$6.95/mo −50%
Telepítés most
14 napos pénzvisszafizetés
  • 1 vCPU @ EPYC
  • 25 GB NVMe
  • 1 TB · 40 Gbps
  • Dedikált IPv4 + IPv6
  • Egykattintásos Ollama
2 GB DDR5

7B / 8B CPU-n

$7.475 /mo
$14.95/mo −50%
Telepítés most
14 napos pénzvisszafizetés
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedikált IPv4 + IPv6
  • Egykattintásos Ollama

GYIK. Ollama VPS

Gyakori kérdések, egyenes válaszok.

Mi az az Ollama VPS?

Az Ollama VPS egy Cloudzy felhőszerver, amelyet az Ollama helyi LLM futtatókörnyezet üzemeltetésére állítottunk be. Tölts le nyílt forráskódú modelleket, például Llama 3, Mistral, Qwen, DeepSeek vagy Gemma; kiszolgálhatod őket a saját OpenAI-kompatibilis API mögött; készíthetsz chat alkalmazásokat, ügynököket és eszközöket anélkül, hogy a forgalmat harmadik féltől származó modellszolgáltatónak küldenéd.

Előre telepített az Ollama?

Az Ollama egy kattintással telepíthető a vezérlőpultról. Válassz egy Linux sablont, a bináris felkerül a PATH-odra, és az `ollama pull llama3` egy percen belül működik. A HTTP API alapértelmezés szerint a 11434-es porton figyel; kösd a dedikált IP-dhez egy fordított proxy mögé.

Futtathatók LLM modellek csak CPU-t tartalmazó VPS-en?

Igen, kisebb modellek esetén. A Llama 3 8B és a Mistral 7B elfut egy 16 GB CPU-s szerveren, a Qwen 0.5B–3B és a Gemma 2B kényelmesen fut 4 GB-on. Az áteresztőképesség a modell méretétől és a prompttól függ; a CPU lassabb, mint a GPU, de kis forgalmú API-ekhez, mellékprojektekhez és fejlesztési munkához megfelelő.

Kínáltok GPU-alapú terveket nagyobb modellekhez?

Igen. 70B-os osztályú modellekhez vagy nagy áteresztőképességű inferenciához tekintsd meg GPU terveinket (RTX 4090, RTX 5090, A100). A 4090 kvantálással kezeli a Llama 3 70B-t; a A100 80 GB teljes precizitású nagy modelleket futtat. A link az árazási oldalon található.

Támogatott az OpenAI-kompatibilis API?

Igen. Az Ollama egy `/v1/chat/completions` végpontot tesz elérhetővé, amely közvetlenül kompatibilis az OpenAI klienssel. Irányítsd a meglévő alkalmazásodat a `http://your-vps:11434/v1` címre, és cseréld le a modell nevét. Ugyanaz az SDK, semmi átírás.

Mennyi helyet foglal egy modell?

Attól függ. Egy 4 bites kvantált 7B-os modell kb. 4 GB. Egy 8B kb. 5 GB. Egy 70B 4 biten ~40 GB. Tölts le annyit, amennyit a tárhelyed elbír. A tervek 60 GB NVMe-vel kezdődnek és 1,5 TB-ig mennek; szabadon kombinálhatsz modelleket egyetlen szerveren.

Milyen gyors a kiépítés?

A fizetés megerősítése után a VPS 60 másodpercen belül elindul. Az Ollama egykattintásos telepítésével a futtatókörnyezet egy percen belül üzemel. Az első modell letöltése hosszabb időt vesz igénybe (hálózatfüggő), de a következők már a NVMe gyorsítótárából töltődnek.

Kapok dedikált IP-t?

Igen, minden VPS dedikált statikus IPv4 és IPv6 mellé kerül. Az Ollama API elérhető a dedikált IP-n; helyezz elé egy Caddy fordított proxyt HTTPS-hez egy valódi hosztnéven, és készen is vagy. Lebegő IP-k is elérhetők.

Vannak rejtett díjak?

Nem. Az egress benne van a havi átviteli keretében. A snapshotok ingyenesek. Az IPv4 + IPv6 benne van. A root hozzáférés benne van. Az egyetlen fizetős extra a Floating IP (2,50 $/hó) és a további snapshotok az ingyenes kvótán felül.

Van pénzvisszafizetési garancia?

Igen, 14 nap a vásárlástól, kérdések nélkül, teljes visszatérítés. Jelentkezzen a panelből vagy írjon a [email protected] címre.

Készen állunk, amikor Ön is.
ollama run, 60 másodperc alatt.

Válassz régiót, kattints, töltsd le a modellt. A saját LLM-od, a saját dedikált IP-d.

Nincs szükség hitelkártyára · 14 napos pénzvisszafizetési garancia · Bármikor lemondható