Ollama
Ollama chạy các LLM ngay trên VPS của bạn. Kéo và phục vụ Llama 3, Mistral, Phi, Gemma và Qwen chỉ với một lệnh. AI tự lưu trữ, không cần khóa API, tương thích với các client OpenAI. Cách đơn giản nhất để chạy inference riêng tư, đang được hơn 200.000 lập trình viên sử dụng.
Phiên bản
Mới nhất
Hệ điều hành
Ubuntu Server 24.04 LTS
RAM tối thiểu
8 GB
Loại IP
IPV4,IPV6