Ollama
Ollama chạy các LLM ngay trên VPS của bạn. Kéo và phục vụ Llama 3, Mistral, Phi, Gemma và Qwen chỉ với một lệnh. AI tự lưu trữ, không cần khóa API, tương thích với các client OpenAI. Cách đơn giản nhất để chạy inference riêng tư, đang được hơn 200.000 lập trình viên sử dụng.
Phiên bản
Mới nhất
Hệ Điều Hành
Ubuntu Server 24.04 LTS Máy chủ
RAM tối thiểu
8 GB
Các loại IP
IPV4,IPV6