50% sleva všechny plány, omezený čas. Od $2.48/mo

Ollama VPS hosting

Spusťte open-source
LLM na vašem VPS.

Ollama-ready VPS na nejnovějším AMD EPYC a čistém NVMe.
Nezávislý od roku 2008. Lama, Mistral, Qwen, DeepSeek, Gemma, vše pod vaší IP.

4.6· 708 reviews on Trustpilot

Od $2.48/mo · 50% sleva · Bez platební karty

~ ssh root@ollama-lon-001připojeno
root@ollama-lon-001:~# ollama vytáhnout lama3
stahování manifestu... stahování modelu 5,0 GB ✔
root@ollama-lon-001:~# ollama run lama3 "Co je to VPS?"
VPS, neboli Virtual Private Server, je virtualizovaný
výpočetní prostředí s vlastním OS a vyhrazené
zdroje, hostované v cloudu...
root@ollama-lon-001:~# _

Ollama VPS na první pohled

Cloudzy hostitelé Ollama-připravené VPS od 12 regionů napříč Severní Amerikou, Evropou, Středním východem a Asií, od 2,48 $ měsíčně. Plány od 512 MB to 64 GB DDR5, vše zapnuto NVMe úložiště s 40 Gbps uplinks. Ollama se nainstaluje jedním kliknutím; SEM Lama 3, Mistral, Qwen, DeepSeek, Gemma a sloužit jim za API kompatibilní s OpenAI. Poskytování serverů v 60 sekund. Cloudzy funguje nezávisle od roku 2008 a má hodnocení 4.6 / 5 by 708+ reviewers na Trustpilotu.

Cena od
2,48 $ / měsíc
Poskytování zásob
60 sekund
Regiony
12 po celém světě
SLA dostupnosti
99.95%
Vrácení peněz
14 dní
Založeno
2008

Proč si vývojáři vybírají Cloudzy

Hostitel LLM oblíbený.

Čtyři věci, na kterých nás zákazníci skutečně srovnávají. Uděláno správně.

Naladěno na vyvozování

AMD EPYC, úložiště pouze NVMe, paměť DDR5, uplinky 40 Gb/s. Model váží zatížení z NVMe v sekundách; žádný pomalý disk škrtí vaši první odpověď.

Vyzkoušej bez rizika

14denní záruka vrácení peněz u každého plánu. Bez otázek. Bez poplatků za zavedení. Zruš z dashboardu kdykoli.

99,95% SLA dostupnosti

Automatizované monitorování ve 12 regionech. SLA za posledních 30 dní je veřejně sledováno na status.cloudzy.com, bez skrývání za PR.

Lidská podpora 24/7

Odpovědi na chatu a tickety obvykle do 5 minut. Inženýři, ne čtenáři skriptů. Medián vyřešení pod 1 hodinu.

Vyberte si svůj model

Modely s otevřenou hmotností.
Jedním tahem pryč.

Llama 3 pro bezpečný výběr, Mistral pro obecný chat, Qwen pro vícejazyčnost, DeepSeek pro kód, Gemma pro drobnou CPU práci. Kombinujte a spojujte, vše na stejném NVMe.

Vlastní nahrávání GGUF je podporováno u každého plánu
Lama 3
8B / 70B / 405B
Mistral
7B / Mixtral 8x7B
Qwen
0,5B – 72B Alibaba
DeepSeek
Kodér / Chat / R1
Gemma
2B / 7B Google
Phi
malé modely společnosti Microsoft

Případy použití

Proč si vývojáři vybírají
Cloudzy Ollama VPS.

Private API pro vaši aplikaci

Umístěte koncový bod kompatibilní s OpenAI na svou vyhrazenou IP. Vytvářejte funkce chatu, shrnutí nebo agenty bez zasílání uživatelských výzev poskytovateli třetí strany.

Agenti na pozadí

Dlouhotrvající agenti, kteří hromadně zpracovávají e-maily, seškrabují weby nebo automaticky označují tiket, nevyhovují API s cenou za použití. Paušální VPS ano. Cron práci, hit Ollama, spát, opakovat.

Asistenti kódu

Spusťte DeepSeek-Coder nebo Qwen-Coder za pluginem Continue / Tabby vašeho editoru. Rychlé automatické doplňování, žádné náklady na návrh, žádný kód zasílán dodavatelům.

Hobby chat a ukázky RAG

Vytáhněte model, připojte Open WebUI nebo LibreChat, sdílejte odkaz s přáteli. Celý stack na jednom VPS za cenu pár káv měsíčně.

LLM přátelské k dodržování předpisů

Citlivá data (právní, zdravotní, interní dokumenty) zůstávají na vašem VPS. Auditujte přístup pomocí iptables a journald, váš model, váš perimetr.

Upečte si vlastní jemné doladění

Vytáhněte základní závaží, dolaďte krabici s GPU a odešlete GGUF zpět do CPU Ollama VPS, abyste mohli usuzovat. Levné servírování ve všední den, marnotratnost, jen když trénujete.

60s
Poskytování zásob
40 Gbps
Uplink
Pouze NVMe
Skladování
12
Regiony
99.95%
SLA dostupnosti
14 dní
Vrácení peněz

Globální síť

12 regionů. Čtyři kontinenty.
Vyberte si svůj, vytáhněte model.

Přesuňte svého odvozeného hostitele poblíž vašich uživatelů. Střední latence P50 pod 10 ms v Severní Americe a Evropě.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

Ceny

Plaťte jen za to, co využíváte. To je celé.

Hodinově, měsíčně, nebo ročně. Žádné poplatky za egress. Žádné závazky. Aktuálně 50% sleva všechny plány.

1 GB DDR5

Malé modely CPU · 1B–3B

$3.48/měs
$6.95/mo−50 %
Nasadit hned
Vrácení peněz do 14 dnů
  • 1 vCPU @ EPYC
  • 25 GB NVMe
  • 1 TB · 40 Gbps
  • Dedikovaná IPv4 + IPv6
  • Ollama jedním kliknutím
2 GB DDR5

7B / 8B na CPU

$7.475/měs
$14.95/mo−50 %
Nasadit hned
Vrácení peněz do 14 dnů
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedikovaná IPv4 + IPv6
  • Ollama jedním kliknutím

FAQ. Ollama VPS

Běžné otázky, přímé odpovědi.

Co je Ollama VPS?

Ollama VPS je cloudový server Cloudzy nastavený pro spuštění Ollama, místního běhového prostředí LLM. Vytáhněte open-source modely jako Llama 3, Mistral, Qwen, DeepSeek nebo Gemma; poskytujte jim své vlastní API kompatibilní s OpenAI; vytvářet chatovací aplikace, agenty a nástroje bez odesílání provozu poskytovateli modelu třetí strany.

Je Ollama předinstalovaná?

Ollama je k dispozici jako instalace jedním kliknutím z panelu. Vyberte linuxovou šablonu, binární soubor přistane na vaší PATH a `ollama pull lama3` funguje během minuty. HTTP API standardně naslouchá na portu 11434; připojte jej k vaší vyhrazené IP za reverzní proxy.

Mohu provozovat LLM na VPS pouze s CPU?

Ano, pro menší modely. Llama 3 8B a Mistral 7B běží na 16GB boxu CPU, Qwen 0,5B–3B a Gemma 2B běží pohodlně na 4 GB. Propustnost závisí na velikosti modelu a výzvě; CPU je pomalejší než GPU, ale je vhodný pro nízkoobjemová API, vedlejší projekty a vývojářskou práci.

Nabízíte plány GPU pro větší modely?

Ano. Pro modely třídy 70B nebo odvození s vysokou propustností viz naše plány GPU (RTX 4090, RTX 5090, A100). 4090 zvládá Llama 3 70B s kvantizací; A100 80GB provozuje velké modely s plnou přesností. Odkazováno ze stránky s cenami.

Je podporováno API kompatibilní s OpenAI?

Ano. Ollama odhaluje koncový bod `/v1/chat/completions`, který je kompatibilní s klientem OpenAI. Namiřte svou stávající aplikaci na `http://your-vps:11434/v1` a změňte název modelu. Stejné SDK, žádné přepisování.

Kolik disku zabere model?

To záleží. 4bitový kvantovaný 7B model má kolem 4 GB. 8B je asi 5 GB. 70B při 4 bitech je ~40 GB. Vytáhněte tolik, kolik máte místa. Plány začínají na 60 GB NVMe a jdou na 1,5 TB; kombinovat modely na jedné krabici.

Jak rychle probíhá zřízení?

Jakmile je platba potvrzena, vaše VPS je aktivní do 60 sekund. S nainstalovaným Ollama's one-click je runtime spuštěn za další minutu. První vytažení modelu trvá déle (síťově vázáno), ale následující jsou ukládány do mezipaměti na NVMe.

Dostanu dedikovanou IP?

Ano, každý VPS je dodáván s vyhrazeným statickým IPv4 plus IPv6. Dosáhněte Ollama API přes dedikovanou IP, přiklepněte Caddy reverzní proxy pro HTTPS na skutečné jméno hostitele a máte hotovo. K dispozici jsou plovoucí IP adresy.

Jsou tam skryté poplatky?

Ne. Egress je zahrnut v tvé měsíční kvótě. Snapshoty jsou zdarma. IPv4 + IPv6 jsou v ceně. Root přístup je v ceně. Jediné placené extra jsou Floating IPs (2,50 $/měs.) a další snapshoty nad rámec kvóty zdarma.

Je k dispozici záruka vrácení peněz?

Ano, 14 dnů od nákupu, bez otázek, plné vrácení peněz. Požádej z panelu nebo napiš na [email protected].

Připraveni, kdykoli jste vy.
ollama run, za 60 sekund.

Vyberte oblast, klikněte a vytáhněte model. Váš soukromý LLM, vaše vyhrazená IP adresa.

Bez platební karty · Vrácení peněz do 14 dnů · Zruš kdykoli