올라마 VPS 호스팅
올라마, 프리로드 및 프라이빗
Ubuntu 24.04 기반에 OpenWebUI가 사전 설치된 전용 Ollama 서버를 즉시 사용하세요. 사전 탑재된 모델로 신속하게 테스트하고, 필요 시 새 모델을 추가하며, 최대 40Gbps 링크로 NVMe에 저장된 포트, 서비스, 스냅샷에 대한 완전한 루트 권한을 유지하세요.
There’s a reason 121,000+ developers & businesses choose us.
환불 보장
온라인 지원
네트워크 속도
네트워크 가동 시간
Pay for what you use. That's it.
Hourly, monthly, or yearly. No egress fees. No surprise bills. No commitments.
- 연간 결제 (40% 할인)
- 월별 결제 (25 할인)
- 시간당 지불 (20% 할인)
- 기본값
Need more power, GPU, or custom specs?
Build your own server올라마 VPS란 무엇인가요?
올라마는 간단한 명령어와 HTTP API로 로컬에서 대규모 언어 모델을 실행할 수 있는 경량 런타임입니다. Cloudzy Ubuntu 24.04 LTS에 OpenWebUI가 사전 설치되어 깔끔한 브라우저 기반 채팅 인터페이스를 제공합니다. 루트 권한과 함께 llama3.2, deepseek r1 등의 스타터 모델을 제공하므로 ollama pull 명령어로 실험을 시작하고 모델을 추가할 수 있습니다. 웹 앱은 포트 8080에서, Ollama API는 11434 포트에서 접근하여 도구 및 코드와 연동할 수 있습니다. 전용 vCPU, DDR5 메모리, NVMe 스토리지를 최대 40Gbps 링크로 제공하는 리소스는 개인 테스트나 소규모 팀 사용에 적합한 규모로 구성됩니다. 스냅샷으로 안전하게 롤백이 가능하며, 필요에 따라 CPU, RAM, 디스크를 확장할 수 있습니다. 제3자 클라우드에 의존하지 않고 직접 제어하는 프라이빗 AI 서비스를 원한다면, CloudzyOllama VPS 호스팅이 채팅, 임베딩, 간단한 RAG를 실행할 수 있는 간편한 기반을 제공합니다.
-
DDoS 보호
-
다양한 결제 방법 이용 가능
-
전체 관리자 권한
-
지연 없는 연결성
-
달라스 GPU 위치
고사양 인프라
최고 수준의 인프라를 갖춘 서버들이 귀하의 워크로드를 원활하고 정시에 처리해 드립니다.
리스크 프리
고객님의 마음의 평안을 위해 환불 보장을 제공합니다.
가동 시간 보장
99.99% 가동 시간을 보장하여 안정적이고 신뢰할 수 있는 연결을 제공합니다.
24시간 연중무휴 돌봄 지원
귀하의 업무는 중요합니다. 저희는 이를 잘 알고 있으며, 귀하를 소중히 여깁니다. 고객 지원팀 역시 마찬가지입니다.
Cloudzy올라마 VPS 호스팅을 선택해야 하는 이유
유연성과 성능의 힘을 발휘하세요
출시 준비 완료
Ubuntu 24.04 LTS에 OpenWebUI와 Ollama가 사전 설치되어 있으며, 즉시 테스트할 수 있는 스타터 모델도 포함됩니다.
성능 최적화
전용 vCPU, NVMe 및 DDR5는 피크 시간대에도 빠른 응답 속도를 유지하는 데 도움이 됩니다.
전체 스택 제어
포트, systemd 서비스, 환경 변수에 대한 루트 접근 권한 및 cloud-init을 통한 첫 부팅 자동화.
깨끗한 다중 사용자 패턴
OpenWebUI 계정을 사용하고, API를 바인딩하며, 스냅샷 작업과 모델별 스토리지를 분리하여 작업하십시오.
믿을 수 있는 기초
빠른 프로비저닝, 고정 IP, 그리고 실험실, 스테이징 또는 소규모 프로덕션 환경을 위한 99.99% 가동 시간 SLA.
누구를 위한 것인가?
개인정보 보호에 중점을 둔 팀이 민감한 초안을 처리합니다
프롬프트와 출력을 전용 서버에 보관하십시오. 해당 서버는 고정 IP, 방화벽 제어 및 데이터 지역성을 위한 지역 호스팅을 지원합니다.
제품 엔지니어 AI 기능 프로토타이핑
서비스에서 11434 API를 호출하고, OpenWebUI로 반복 처리하며, 작업 상태를 보호하기 위해 각 변경 전 스냅샷을 생성하십시오.
교육자 및 실험실 지도교수
학생들에게 풀(pull), 프롬프트(prompt), 기본적인 RAG 연습을 학습할 수 있도록 루트 권한이 부여된 일관된 OpenWebUI 프론트엔드를 제공하십시오.
사용 방법?
Ollama VPS 설정 방법
시작하는 방법을 모르시나요? CloudzyOllama VPS 호스팅을 이용하면 Ollama와 OpenWebUI가 설치된 Ubuntu 24.04 LTS 환경을 바로 사용할 수 있습니다. 루트 권한으로 SSH 접속 후cloudzy 확인하고 서비스가 정상적으로 실행 중인지 점검하세요. OpenWebUI는 http://:8080에서, API는 http://:11434에서 접근 가능합니다. 필요에 따라 모델을 불러오거나 전환하세요. 다른 호스트나 프록시를 통해 API에 접근할 계획이라면 적절한 환경 변수와 방화벽 규칙을 설정하세요. 아래 단계는 기본 사항을 다룹니다.
Cloudzy, 사용자들의 목소리로
121457 개발자들이 Cloudzy 업무 흐름에 어떻게 Cloudzy 들어보세요.
중단 없는 엔지니어링
Cloudzy 우리 엔지니어링 팀은 인프라가 아닌 혁신에 집중할 Cloudzy . 우리는 그들의 고성능 서버를 활용해 대용량 파일과 소프트웨어 라이선스를 관리하며, 첫날부터 지금까지 단 한 번의 기술적 문제나 서비스 중단도 경험하지 않았습니다.
토론토 대학교(University of Toronto) UTFR 팀 주장
자주 묻는 질문 | Ollama VPS
올라마란 무엇이며 어떻게 작동하나요?
Ollama는 간단한 명령어와 HTTP API를 통해 대규모 언어 모델을 제공하는 로컬 런타임입니다. 모델을 실행하거나 불러온 후, /api/generate 또는 OpenAI 호환 /v1/chat/completions와 같은 엔드포인트를 통해 상호작용할 수 있습니다.
Ollama를 실행 GPU 가 필요한가요?
아니요. CPU 작동하지만, 호환되는 GPU 사용하면 추론을 가속화할 GPU . NVIDIA, AMD ROCm 및 Apple Silicon은 각각의 스택을 통해 지원됩니다.
일반적인 모델을 위해 Ollama는 얼마나 많은 RAM이 필요합니까?
일반적으로 7B 모델은 약 8GB RAM, 13B 모델은 약 16GB RAM, 70B 모델은 약 64GB RAM이 필요합니다(표준 양자화 설정 기준).
올라마는 오프라인에서 사용할 수 있나요?
예. 초기 모델 다운로드 후에는 외부 서비스 없이 로컬에서 모델을 실행할 수 있습니다. API는 기본적으로 포트 11434에서 호스트에 의해 제공됩니다.
Ollama에서 모델을 추가하거나 전환하는 방법은 무엇인가요?
ollama pull 명령어를 사용하여 모델을 다운로드하고, ollama run 명령어로 채팅을 시작하세요. llama3.2 및 deepseek-r1과 같은 모델 페이지에는 태그와 크기가 나열되어 있습니다.
Cloudzy VPS에서 어떤 접근 권한을 얻을 수 있나요?
Ubuntu 24.04에 Ollama와 OpenWebUI가 설치된 상태로 완전한 루트 권한을 부여받습니다. OpenWebUI는 포트 8080에서, Ollama API는 포트 11434에서 이용 가능하며, Ollama VPS와의 연동을 위해 사용됩니다.
Cloudzy Ollama VPS 호스팅의 성능을 어떻게 Cloudzy ?
플랜은 전용 vCPU, DDR5 메모리 및 NVMe 스토리지를 최대 40Gbps 링크로 활용하여 왕복 시간을 최소화합니다. Ollama VPS 호스팅에서 워크로드가 확장될 경우 CPU 전용으로 시작하여 GPU 지원 이미지를 고려할 수 있습니다.
Cloudzy 서버에서 OpenWebUI와 API에 어떻게 접근하나요?
OpenWebUI를 이용하려면 http://:8080를 방문하십시오. 프로그래매틱 액세스는 http://:11434를 사용합니다. 다른 호스트에서 연결하는 경우 필요에 따라 바인딩 및 허용된 원본을 구성하십시오.
Cloudzy VPS에서 사용할 수 있는 보안 옵션은 무엇입니까?
SSH 키 및 방화벽 규칙을 제어하고, API 노출을 제한하며, 필요한 경우 서비스를 프록시 뒤에 배치하십시오. OpenWebUI는 환경 구성을 통해 원격 Ollama 엔드포인트를 지원합니다.
Cloudzy VPS를 확장하거나 스냅샷을 생성할 수 있나요? 가동 시간은 어떻게 적용되나요?
예. 프로젝트가 성장함에 따라 CPU, RAM 또는 디스크를 확장하고 주요 변경 전 스냅샷을 생성하십시오. 플랫폼은 예측 가능한 접근을 위해 99.99% 가동 시간 SLA를 목표로 합니다.
도움이 필요하신가요? 고객 지원팀에 문의하세요.
16 regions. Four continents. One click away.
Put your server next to your users. Anywhere in the world, in under a minute.
0Gbps 네트워크 속도
0.00% 네트워크 가동 시간
<0ms Average Latency
0/7 모니터링