Přejít na hlavní obsah
Sleva 50% všechny plány, omezený čas. Od $2.48/mo

Hosting Ollama VPS

Provozujte open-source
LLMy na svém VPS.

VPS připravený pro Ollama s nejnovějším AMD EPYC a čistým NVMe.
Nezávislí od roku 2008. Llama, Mistral, Qwen, DeepSeek, Gemma, vše pod vaší IP adresou.

4.7 · 755 reviews on Trustpilot

Od $2.48/mo · Sleva 50% · Bez kreditní karty

~ ssh root@ollama-lon-001 připojen
root@ollama-lon-001:~# ollama pull llama3
pulling manifest... pulling model 5.0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "What's a VPS?"
A VPS, or Virtual Private Server, is a virtualized
computing environment with its own OS and dedicated
resources, hosted in the cloud...
root@ollama-lon-001:~# _

Ollama VPS v kostce

Cloudzy hostuje Ollama-připravené VPS od 13 regionů napříč Severní Amerikou, Evropou, Středním východem a Asií, od $2.48 per month. Plány od 512 MB to 64 GB DDR5, vše na NVMe úložiště s 40 Gbps připojení na vyšší úroveň Ollama installs in one click; pull Llama 3, Mistral, Qwen, DeepSeek, Gemma a obsluhujte je přes OpenAI-kompatibilní APIServery se zřizují v 60 sekund. Cloudzy has operated independently since 2008 a má hodnocení 4.7 / 5 by 755+ reviewers na Trustpilotu.

Cena od
$2.48 / month
Zřizování
60 sekund
Oblasti
13 po celém světě
SLA dostupnosti
99.95%
Vrácení peněz
14 dní
Založeno
2008

Proč si vývojáři vybírají Cloudzy

Hostitel LLM oblíbené

Čtyři věci, na kterých nás zákazníci skutečně srovnávají. Uděláno správně.

Optimalizováno pro inferenci

AMD EPYC, úložiště pouze na NVMe, paměť DDR5, 40 Gbps uplinks. Váhy modelu se načtou z NVMe během pár sekund - žádný pomalý disk, který by zdržoval první odpověď.

Vyzkoušej bez rizika

14denní záruka vrácení peněz u každého plánu. Bez otázek. Bez poplatků za zavedení. Zruš z dashboardu kdykoli.

99,95% SLA dostupnosti

Automatizované monitorování ve 13 regionech. SLA za posledních 30 dní je veřejně sledováno na status.cloudzy.com, bez skrývání za PR.

Lidská podpora 24/7

Odpovědi na chatu a tickety obvykle do 5 minut. Inženýři, ne čtenáři skriptů. Medián vyřešení pod 1 hodinu.

Vyberte model

Modely s otevřenými váhami.
Jeden příkaz a jedete.

Llama 3 jako spolehlivá volba, Mistral pro obecný chat, Qwen pro vícejazyčné použití, DeepSeek pro kód, Gemma pro nenáročné CPU úlohy. Kombinujte libovolně, vše na jednom NVMe.

Nahrání vlastního GGUF podporováno v každém plánu
Llama 3
8B / 70B / 405B
Mistral
7B / Mixtral 8x7B
Qwen
0,5B – 72B Alibaba
DeepSeek
Coder / Chat / R1
Gemma
2B / 7B Google
Phi
Malé modely od Microsoftu

Případy použití

Proč si vývojáři vybírají
Cloudzy Ollama VPS.

Privátní API pro vaši aplikaci

OpenAI-kompatibilní endpoint přímo na vaší dedikované IP. Stavte chatovací funkce, sumarizátory nebo agenty, aniž byste odesílali uživatelské dotazy třetí straně.

Agenti na pozadí

Dlouhodobě běžící agenti, kteří dávkově zpracovávají e-maily, scrapují weby nebo automaticky tagují tikety, se do usage-based API nevejdou. Paušální VPS ano. Naplánujte úlohu přes cron, zavolejte Ollama, počkejte, opakujte.

Asistenti kódu

Spusťte DeepSeek-Coder nebo Qwen-Coder za Continue / Tabby pluginem vašeho editoru. Rychlé doplňování kódu, žádné poplatky za návrh, žádný kód odesílaný k vendorům.

Hobby chat a RAG dema

Stáhněte model, napojte Open WebUI nebo LibreChat, sdílejte odkaz s přáteli. Celý stack na jednom VPS za cenu pár káv měsíčně.

LLM splňující požadavky na shodu

Citlivá data (právní, zdravotnická, interní dokumenty) zůstávají na vašem VPS. Auditujte přístupy pomocí iptables a journald, váš model, váš perimetr.

Trénujte vlastní fine-tuny

Stáhněte základní váhy, dotrénujte na GPU stroji, nahrajte GGUF zpět na CPU Ollama VPS pro inferenci. Levný provoz ve všední dny, investujte jen při trénování.

60s
Zřizování
40 Gbps
Spojení nahoru
Pouze NVMe
Úložiště
13
Oblasti
99.95%
SLA dostupnosti
14 days
Vrácení peněz

Globální síť

13 regionů. Čtyři kontinenty.
Vyberte si svůj a stáhněte model.

Umístěte inference server blízko vašich uživatelů. Medián P50 latence pod 10 ms v Severní Americe a Evropě.

us-utah-1us-dal-1us-lax-1us-lvg-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Ceny

Plaťte jen za to, co využíváte. To je celé.

Hodinově, měsíčně, nebo ročně. Žádné poplatky za egress. Žádné závazky. Aktuálně Sleva 50% všechny plány.

1 GB DDR5

Malé CPU modely · 1B–3B

$3.48 /mo
$6.95/mo −50%
Nasadit hned
Vrácení peněz do 14 dnů
  • 1 vCPU @ EPYC
  • 25 GB NVMe
  • 1 TB · 40 Gbps
  • Dedikovaná IPv4 + IPv6
  • Ollama jedním kliknutím
2 GB DDR5

7B / 8B na CPU

$7.475 /mo
$14.95/mo −50%
Nasadit hned
Vrácení peněz do 14 dnů
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Dedikovaná IPv4 + IPv6
  • Ollama jedním kliknutím

Často kladené otázky. Ollama VPS

Běžné otázky, přímé odpovědi.

Co je Ollama VPS?

Ollama VPS je Cloudzy cloudový server nakonfigurovaný ke spuštění Ollama, runtime pro lokální LLM. Stáhněte open-source modely jako Llama 3, Mistral, Qwen, DeepSeek nebo Gemma, provozujte je za vlastním OpenAI-kompatibilním API a stavte chatovací aplikace, agenty i nástroje bez odesílání provozu třetímu poskytovateli modelů.

Je Ollama předinstalován?

Ollama je dostupný jako instalace jedním kliknutím přímo z panelu. Vyberte šablonu Linux, binárka se přidá do PATH a `ollama pull llama3` funguje do minuty. HTTP API Ollama naslouchá na portu 11434; připojte ho k vaší dedikované IP za reverzní proxy.

Mohu spouštět LLM modely na VPS pouze s CPU?

Ano, pro menší modely. Llama 3 8B a Mistral 7B běží na stroji s 16 GB CPU, Qwen 0.5B–3B a Gemma 2B pohodlně na 4 GB. Propustnost závisí na velikosti modelu a promptu. CPU je pomalejší než GPU, ale pro nízkou zátěž, vedlejší projekty a vývojové účely to stačí.

Nabízíte plány s GPU pro větší modely?

Ano. Pro modely třídy 70B nebo vysokou propustnost inference se podívejte na naše GPU plány (RTX 4090, RTX 5090, A100). RTX 4090 zvládne Llama 3 70B s kvantizací; A100 80 GB spustí velké modely v plné přesnosti. Odkaz najdete na stránce s cenami.

Je podporován OpenAI-kompatibilní API?

Ano. Ollama zpřístupňuje endpoint `/v1/chat/completions`, který je přímo kompatibilní s OpenAI klientem. Nasměrujte svou stávající aplikaci na `http://your-vps:11434/v1` a změňte název modelu. Stejné SDK, žádné přepisování.

Kolik místa na disku model zabere?

Záleží na modelu. 4-bitově kvantizovaný model 7B zabírá přibližně 4 GB. Model 8B přibližně 5 GB. Model 70B na 4 bity přibližně 40 GB. Stáhněte si tolik modelů, kolik máte místa. Plány začínají na 60 GB NVMe a sahají až na 1,5 TB; modely na jednom stroji lze libovolně kombinovat.

Jak rychle probíhá zřízení?

Jakmile je platba potvrzena, váš VPS běží do 60 sekund. S nainstalovaným Ollama jedním kliknutím je runtime připravený za další minutu. První stažení modelu trvá déle (omezeno sítí), další jsou ale rychle k dispozici z mezipaměti na NVMe.

Dostanu dedikovanou IP?

Ano, každý VPS má dedikovanou statickou IPv4 adresu a IPv6. Ollama API je dostupný přes dedikovanou IP; přidejte před něj reverzní proxy Caddy pro HTTPS s vlastní doménou a je to. Plovoucí IP adresy jsou k dispozici.

Jsou tam skryté poplatky?

Ne. Egress je zahrnut v tvé měsíční kvótě. Snapshoty jsou zdarma. IPv4 + IPv6 jsou v ceně. Root přístup je v ceně. Jediné placené extra jsou Floating IPs (2,50 $/měs.) a další snapshoty nad rámec kvóty zdarma.

Je k dispozici záruka vrácení peněz?

Ano, 14 dnů od nákupu, bez otázek, plné vrácení peněz. Požádej z panelu nebo napiš na [email protected].

Připraveni, kdykoli jste vy.
ollama run, za 60 sekund.

Vyberte region, klikněte, stáhněte model. Váš soukromý LLM, vaše dedikovaná IP.

Bez platební karty · Vrácení peněz do 14 dnů · Zruš kdykoli