50% off minden csomagra, korlátozott ideig. Kezdőár: $2.48/mo

Ollama VPS Hosting

Futtass nyílt forráskódú
LLM-eket a saját VPS-eden.

Ollama-kész VPS a legújabb AMD EPYC-en és tiszta NVMe-n.
Independent since 2008. Llama, Mistral, Qwen, DeepSeek, Gemma, mind a saját IP-d alatt.

4.6· 713 reviews on Trustpilot

Starting at $2.48/mo · 50% kedvezmény · Bankkártya nem szükséges

~ ssh root@ollama-lon-001connected
root@ollama-lon-001:~# ollama pull llama3
pulling manifest... pulling model 5.0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "Mi az a VPS?"
A VPS, vagyis a Virtual Private Server, egy virtualizált
számítási környezet, saját operációs rendszerrel és dedikált
erőforrásokkal, amelyet a felhőben üzemeltetnek...
root@ollama-lon-001:~# _

Ollama VPS egy pillantásra

Cloudzy hosts Ollama-kész VPS-ek ettől: 12 regions Észak-Amerikában, Európában, a Közel-Keleten és Ázsiában, kezdve $2.48 per month. A csomagok ártól 512 MB to 64 GB DDR5, all on NVMe storage with 40 Gbps uplink-ekkel. A Ollama egykattintásra települ; töltsd le a Llama 3, Mistral, Qwen, DeepSeek, Gemma és kiszolgálhatod őket egy OpenAI-kompatibilis API mögött. Servers provision in 60 seconds alatt elindulnak. Cloudzy független szolgáltatóként működik 2008 and is rated 4.6 / 5 by 713+ reviewers on Trustpilot.

Starting price
$2.48 / month
Provisioning
60 seconds
Regions
12 worldwide
Uptime SLA
99.95%
Money-back
14 days
Founded
2008

Miért választják a fejlesztők a Cloudzy-t

An LLM host favorite.

A négy szempont, amelyen a vásárlók ténylegesen összehasonlítanak minket - és mindegyiken helytállunk.

Inferenciára hangolva

AMD EPYC, kizárólag NVMe alapú tárolás, DDR5 memória, 40 Gbps uplink. A modellsúlyok másodpercek alatt betöltődnek NVMe-ről; semmi lassú lemez nem fojtja el az első választ.

Kockázatmentes próbaidőszak

14 napos pénzvisszafizetési garancia minden csomagra. Kérdések nélkül. Telepítési díj nélkül. A dashboardról bármikor lemondható.

99.95% uptime SLA

Automatizált monitorozás 12 régióban. Az elmúlt 30 nap SLA-adatai nyilvánosan követhetők a status.cloudzy.com oldalon – nincs mit titkolni.

24/7 human support

Élő chat és jegyválaszok jellemzően 5 percen belül. Mérnökök, nem forgatókönyv-olvasók. Medián megoldási idő 1 óra alatt.

Válassz modellt

Nyílt súlyú modellek.
Egy pull-ra elérhető.

Llama 3 a biztos választáshoz, Mistral általános feladatokhoz, Qwen többnyelvű munkához, DeepSeek kódhoz, Gemma kis CPU feladatokhoz. Kombináld őket szabadon, mind ugyanazon az NVMe-n.

Egyedi GGUF feltöltés minden csomagban elérhető
Llama 3
8B / 70B / 405B
Mistral
7B / Mixtral 8x7B
Qwen
0.5B – 72B Alibaba
DeepSeek
Coder / Chat / R1
Gemma
2B / 7B Google
Phi
Microsoft kis modellek

Use cases

Miért választják a fejlesztők
Cloudzy Ollama VPS-ja.

Privát API az alkalmazásodhoz

OpenAI-kompatibilis végpont a dedikált IP-dre telepítve. Építs chat funkciókat, összefoglalókat vagy ágenseket anélkül, hogy felhasználói promptokat küldenél harmadik félhez.

Background agents

A hosszú futású ágensek, amelyek e-maileket dolgoznak fel kötegesen, oldalakat szkrépelnek, vagy jegyeket címkéznek automatikusan, nem férnek bele a használatalapú árazású API-okba. Egy fix díjas VPS igen. Ütemezz egy feladatot, hívd meg a Ollama-t, várj, ismételd.

Code assistants

Futtatd a DeepSeek-Coder-t vagy a Qwen-Coder-t az editorod Continue / Tabby pluginjének hátterében. Gyors kódkiegészítés, nulla per-suggestion költség, és a kódod nem kerül ki külső szolgáltatóhoz.

Hobbi chat és RAG demók

Tölts le egy modellt, kapcsold össze az Open WebUI-jal vagy a LibreChat-tel, és oszd meg a linket barátokkal. Az egész stack egyetlen VPS-n, havi néhány kávé áráért.

Megfelelőség-barát LLM-ok

Az érzékeny adatok (jogi, egészségügyi, belső dokumentumok) az VPS-den maradnak. Auditáld a hozzáférést iptables-szel és journald-del: a te modelled, a te periméterd.

Készítsd el saját fine-tune-jaidat

Töltsd le az alap súlyokat, finomhangolj egy GPU gépen, majd töltsd vissza a GGUF-ot egy CPU Ollama VPS-re inferenciához. Olcsó hétköznapi kiszolgálás, és csak edzéskor költs többet.

60s
Provisioning
40 Gbps
Uplink
NVMe-only
Storage
12
Regions
99.95%
Uptime SLA
14 days
Money-back

Global network

12 régió. Négy kontinens.
Válaszd ki a megfelelőt, tölts le egy modellt.

Helyezd az inferencia-hosztot a felhasználóid közelébe. A P50 medián késleltetés 10 ms alatt van Észak-Amerikában és Európában.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

Pricing

Csak annyit fizet, amennyit használ. That's it.

Óránként, havonta vagy évente. Kimenő forgalmi díj nélkül. Kötöttségek nélkül. Jelenleg 50% off all plans.

1 GB DDR5

Kis CPU modellek · 1B–3B

$3.48/mo
$6.95/mo−50%
Deploy now
14 napos visszatérítési garancia
  • 1 vCPU @ EPYC
  • 25 GB NVMe
  • 1 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Egykattintásos Ollama
2 GB DDR5

7B / 8B on CPU

$7.475/mo
$14.95/mo−50%
Deploy now
14 napos visszatérítési garancia
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedicated IPv4 + IPv6
  • Egykattintásos Ollama

GYIK. Ollama VPS

Common questions, straight answers.

Mi az az Ollama VPS?

Az Ollama VPS egy Cloudzy felhőszerver, amelyet az Ollama helyi LLM futtatókörnyezet üzemeltetésére állítottunk be. Tölts le nyílt forráskódú modelleket, például Llama 3, Mistral, Qwen, DeepSeek vagy Gemma; kiszolgálhatod őket a saját OpenAI-kompatibilis API mögött; készíthetsz chat alkalmazásokat, ügynököket és eszközöket anélkül, hogy a forgalmat harmadik féltől származó modellszolgáltatónak küldenéd.

Előre telepített az Ollama?

Az Ollama egy kattintással telepíthető a vezérlőpultról. Válassz egy Linux sablont, a bináris felkerül a PATH-odra, és az `ollama pull llama3` egy percen belül működik. A HTTP API alapértelmezés szerint a 11434-es porton figyel; kösd a dedikált IP-dhez egy fordított proxy mögé.

Futtathatók LLM modellek csak CPU-t tartalmazó VPS-en?

Igen, kisebb modellek esetén. A Llama 3 8B és a Mistral 7B elfut egy 16 GB CPU-s szerveren, a Qwen 0.5B–3B és a Gemma 2B kényelmesen fut 4 GB-on. Az áteresztőképesség a modell méretétől és a prompttól függ; a CPU lassabb, mint a GPU, de kis forgalmú API-ekhez, mellékprojektekhez és fejlesztési munkához megfelelő.

Kínáltok GPU-alapú terveket nagyobb modellekhez?

Igen. 70B-os osztályú modellekhez vagy nagy áteresztőképességű inferenciához tekintsd meg GPU terveinket (RTX 4090, RTX 5090, A100). A 4090 kvantálással kezeli a Llama 3 70B-t; a A100 80 GB teljes precizitású nagy modelleket futtat. A link az árazási oldalon található.

Támogatott az OpenAI-kompatibilis API?

Igen. Az Ollama egy `/v1/chat/completions` végpontot tesz elérhetővé, amely közvetlenül kompatibilis az OpenAI klienssel. Irányítsd a meglévő alkalmazásodat a `http://your-vps:11434/v1` címre, és cseréld le a modell nevét. Ugyanaz az SDK, semmi átírás.

Mennyi helyet foglal egy modell?

Attól függ. Egy 4 bites kvantált 7B-os modell kb. 4 GB. Egy 8B kb. 5 GB. Egy 70B 4 biten ~40 GB. Tölts le annyit, amennyit a tárhelyed elbír. A tervek 60 GB NVMe-vel kezdődnek és 1,5 TB-ig mennek; szabadon kombinálhatsz modelleket egyetlen szerveren.

Milyen gyors a kiépítés?

A fizetés megerősítése után a VPS 60 másodpercen belül elindul. Az Ollama egykattintásos telepítésével a futtatókörnyezet egy percen belül üzemel. Az első modell letöltése hosszabb időt vesz igénybe (hálózatfüggő), de a következők már a NVMe gyorsítótárából töltődnek.

Do I get a dedicated IP?

Igen, minden VPS dedikált statikus IPv4 és IPv6 mellé kerül. Az Ollama API elérhető a dedikált IP-n; helyezz elé egy Caddy fordított proxyt HTTPS-hez egy valódi hosztnéven, és készen is vagy. Lebegő IP-k is elérhetők.

Vannak rejtett díjak?

Nem. A kimenő forgalom benne van a havi adatforgalmi keretedben. A snapshotok ingyenesek. A IPv4 és a IPv6 szintén benne van az árban. A root hozzáférés is alapból jár. Fizetős extra csak a Floating IP (2,50 $/hó) és az ingyenes keretén túli további snapshotok.

Van pénzvisszafizetési garancia?

Igen, a vásárlástól számított 14 napon belül, kérdések nélkül, teljes visszatérítéssel. Igényelje a vezérlőpultból vagy írjon a [email protected] címre.

Készen állunk, ha te is készen vagy.
ollama run, 60 másodperc alatt.

Válassz régiót, kattints, töltsd le a modellt. A saját LLM-od, a saját dedikált IP-d.

Nem szükséges bankkártya · 14 napos pénzvisszafizetési garancia · Bármikor lemondható