50% de desconto todos os planos, tempo limitado. A partir de $2.48/mo

Hospedagem VPS Ollama

Execute código aberto
LLMs em seu VPS.

VPS pronto para Ollama no mais recente AMD EPYC e NVMe puro.
Independente desde 2008. Lhama, Mistral, Qwen, DeepSeek, Gemma, tudo sob o seu IP.

4.6· 708 reviews on Trustpilot

A partir de $2.48/mo · 50% de desconto · sem cartão de crédito

~ ssh root@ollama-lon-001conectado
root@ollama-lon-001:~# ollama puxa lhama3
puxando manifesto... puxando modelo 5.0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "O que é um VPS?"
Um VPS, ou Virtual Private Server, é um servidor virtualizado
ambiente de computação com sistema operacional próprio e dedicado
recursos, hospedados na nuvem...
root@ollama-lon-001:~# _

Ollama VPS em resumo

Cloudzy anfitriões Ollama-VPSes prontos de 12 regiões na América do Norte, Europa, Médio Oriente e Ásia, a partir de $2,48 por mês. Os planos vão de 512 MB to 64 GB DDR5, tudo ligado Armazenamento NVMe com 40 Gbps ligações ascendentes. Ollama é instalado com um clique; puxar Lhama 3, Mistral, Qwen, DeepSeek, Gemma e servi-los atrás de um API compatível com OpenAI. Provisão de servidores em 60 segundos. A Cloudzy opera de forma independente desde 2008 e está classificada com 4.6 / 5 by 708+ reviewers no Trustpilot.

Preço inicial
$2,48 / mês
Provisionamento
60 segundos
Regiões
12 em todo o mundo
SLA de uptime
99.95%
Devolução do dinheiro
14 dias
Fundado
2008

Porque os programadores escolhem a Cloudzy

Um anfitrião LLM favorito.

As quatro coisas que os compradores realmente comparam, feitas como deve ser.

Ajustado para inferência

AMD EPYC, armazenamento somente NVMe, memória DDR5, uplinks de 40 Gbps. O modelo pesa o carregamento do NVMe em segundos; nenhum disco lento sufocando sua primeira resposta.

Teste sem risco

Garantia de devolução do dinheiro em 14 dias em todos os planos. Sem perguntas. Sem taxas de configuração. Cancele a partir do painel a qualquer momento.

SLA de uptime 99,95%

Monitorização automatizada em 12 regiões. O SLA dos últimos 30 dias é seguido publicamente em status.cloudzy.com, sem se esconder atrás de relações públicas.

Suporte humano 24/7

Respostas no chat e em tickets em menos de 5 minutos. Engenheiros, não leitores de scripts. Resolução média em menos de 1 hora.

Escolha seu modelo

Modelos de peso aberto.
Um puxão de distância.

Llama 3 para a escolha segura, Mistral para bate-papo geral, Qwen para multilíngue, DeepSeek para código, Gemma para pequenos trabalhos CPU. Misture e combine, tudo no mesmo NVMe.

Upload personalizado de GGUF compatível com todos os planos
Lhama 3
8B/70B/405B
Mistral
7B / Mixtral 8x7B
Qwen
0,5B – 72B Alibaba
DeepSeek
Codificador / Bate-papo / R1
Gema
2B/7BGoogle
Fi
Modelos pequenos da Microsoft

Casos de uso

Porque os programadores escolhem
Ollama VPS da Cloudzy.

API privada para seu aplicativo

Endpoint compatível com OpenAI em seu IP dedicado. Crie recursos de chat, resumidores ou agentes sem enviar solicitações de usuário a um provedor terceirizado.

Agentes de segundo plano

Agentes de longa duração que processam e-mails em lote, raspam sites ou etiquetam automaticamente tickets não se enquadram em APIs com preço de uso. Um VPS de taxa fixa sim. Cron um trabalho, bata em Ollama, durma, repita.

Assistentes de código

Execute DeepSeek-Coder ou Qwen-Coder por trás do plugin Continue / Tabby do seu editor. Preenchimento automático rápido, sem custo por sugestão, sem envio de código aos fornecedores.

Bate-papo sobre passatempos e demonstrações RAG

Puxe um modelo, conecte Open WebUI ou LibreChat, compartilhe um link com amigos. A pilha inteira em um VPS pelo preço de alguns cafés por mês.

LLMs compatíveis com conformidade

Dados confidenciais (jurídicos, de saúde, documentos internos) permanecem no seu VPS. Audite o acesso com iptables e journald, seu modelo, seu perímetro.

Faça suas próprias melodias

Puxe os pesos básicos, faça o ajuste fino em uma caixa de GPU e envie o GGUF de volta para uma CPU Ollama VPS para inferência. Serviço barato durante a semana, faça alarde apenas quando treinar.

60s
Provisionamento
40 Gbps
Ligação ascendente
Somente NVMe
Armazenar
12
Regiões
99.95%
SLA de uptime
14 dias
Devolução do dinheiro

Rede global

12 regiões. Quatro continentes.
Escolha o seu, puxe um modelo.

Coloque seu host de inferência próximo aos seus usuários. Latência média do P50 inferior a 10 ms na América do Norte e na Europa.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-zrh-1me-dxb-1ap-sgp-1ap-tyo-1

Preços

Pague apenas pelo que usa. É isso.

À hora, ao mês ou ao ano. Sem taxas de saída. Sem compromissos. Atualmente 50% de desconto todos os planos.

1 GB DDR5

Modelos de CPU minúsculos · 1B–3B

$3.48/ mês
$6.95/mo−50%
Implantar agora
Reembolso em 14 dias
  • 1 vCPU @ EPYC
  • 25 GB NVMe
  • 1 TB · 40 Gbps
  • IPv4 + IPv6 dedicados
  • Ollama com um clique
2 GB DDR5

7B/8B na CPU

$7.475/ mês
$14.95/mo−50%
Implantar agora
Reembolso em 14 dias
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • IPv4 + IPv6 dedicados
  • Ollama com um clique

PERGUNTAS FREQUENTES. Ollama VPS

Perguntas comuns, respostas diretas.

O que é um VPS Ollama?

Um Ollama VPS é um servidor em nuvem Cloudzy configurado para executar o Ollama, o tempo de execução local do LLM. Obtenha modelos de código aberto como Llama 3, Mistral, Qwen, DeepSeek ou Gemma; servi-los por trás de sua própria API compatível com OpenAI; crie aplicativos de bate-papo, agentes e ferramentas sem enviar tráfego para um provedor de modelo terceirizado.

O Ollama está pré-instalado?

Ollama está disponível para instalação com um clique no painel. Escolha um modelo Linux, o binário chega ao seu PATH e `ollama pull llama3` funciona em um minuto. A API HTTP escuta na porta 11434 por padrão; vincule-o ao seu IP dedicado por trás de um proxy reverso.

Posso executar LLMs em um VPS somente com CPU?

Sim, para modelos menores. Llama 3 8B e Mistral 7B rodam em uma caixa CPU de 16 GB, Qwen 0.5B–3B e Gemma 2B rodam confortavelmente em 4 GB. O rendimento depende do tamanho do modelo e do prompt; CPU é mais lento que GPU, mas é adequado para APIs de baixo volume, projetos paralelos e trabalho de desenvolvimento.

Vocês oferecem planos de GPU para modelos maiores?

Sim. Para modelos da classe 70B ou inferência de alto rendimento, consulte nossos planos de GPU (RTX 4090, RTX 5090, A100). O 4090 lida com Llama 3 70B com quantização; O A100 80GB roda modelos grandes com precisão total. Linkado na página de preços.

A API compatível com OpenAI é compatível?

Sim. Ollama expõe um endpoint `/v1/chat/completions` que é compatível com o cliente OpenAI. Aponte seu aplicativo existente para `http://your-vps:11434/v1` e mude o nome do modelo. Mesmo SDK, sem reescrita.

Quanto disco um modelo ocupa?

Depende. Um modelo 7B quantizado de 4 bits tem cerca de 4 GB. Um 8B tem cerca de 5 GB. Um 70B de 4 bits equivale a aproximadamente 40 GB. Puxe quantos você tiver espaço. Os planos começam em 60 GB NVMe e vão até 1,5 TB; misture e combine modelos em uma caixa.

Quão rápido é o provisionamento?

Assim que o pagamento for confirmado, seu VPS estará ativo em 60 segundos. Com o clique único do Ollama instalado, o tempo de execução termina em mais um minuto. O primeiro modelo pull leva mais tempo (ligado à rede), mas os subsequentes são armazenados em cache quente no NVMe.

Recebo um IP dedicado?

Sim, todo VPS vem com um IPv4 estático dedicado mais IPv6. Acesse a API Ollama através do IP dedicado, coloque um proxy reverso Caddy na frente para HTTPS em um nome de host real e pronto. IPs flutuantes estão disponíveis.

Existem taxas ocultas?

Não. O tráfego de saída está incluído na sua quota mensal de transferência. Os snapshots são gratuitos. IPv4 + IPv6 estão incluídos. O acesso root está incluído. Os únicos extras pagos são IPs flutuantes ($2,50/mês) e snapshots adicionais além da quota gratuita.

Existe garantia de reembolso?

Sim, 14 dias após a compra, sem perguntas, reembolso total. Solicite no painel ou envie email para [email protected].

Prontos quando você estiver.
corrida ollama, em 60 segundos.

Escolha uma região, clique, extraia um modelo. Seu LLM privado, seu IP dedicado.

Sem cartão de crédito · garantia de reembolso em 14 dias · cancele quando quiser