تخطَّ إلى المحتوى الرئيسي
خصم ٥٠٪ جميع الخطط، لفترة محدودة. تبدأ من $2.48/mo

استضافة ChatGPT VPS

خادمك الخاص للذكاء الاصطناعي،
قواعدك أنت.

Self-host open-weight LLMs and AI APIs on AMD EPYC with NVMe storage.
Independent cloud since 2008, no vendor lock-in, no usage caps.
Trusted by 122,000+ users · from $2.48/mo.

4.7 · 755 reviews on Trustpilot

تبدأ من $2.48/mo · خصم ٥٠٪ · لا حاجة لبطاقة ائتمان

~ ssh root@ai-001 متصل
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Installing Ollama...
Ollama installed successfully.
root@ai-001:~# ollama pull llama3
pulling model llama3... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

نظرة عامة على VPS بأسلوب ChatGPT

Cloudzy offers ChatGPT VPS hosting for self-hosting LLMs and AI inference across 13 regions, starting at $2.48/mo. Every plan runs on AMD EPYC with DDR5 memory, NVMe storage, and 40 Gbps uplinks. Install Ollama, llama.cpp, vLLM, or your own inference stack, full root access, no API rate limits. Provision in 60 seconds. Independent since 2008, rated 4.7/5 by 700+ reviewers on Trustpilot.

السعر الابتدائي
2.48 $ / شهر
CPU
AMD EPYC · DDR5
التهيئة
60 ثانية
المناطق
13 حول العالم
استرداد المبالغ
١٤ يومًا
التأسيس
2008

لماذا يختار المطورون Cloudzy

ذو خبرة تقنية المطورين المحترفين.

الأمور الأربعة التي يقارن بها المشترون فعلًا، أحسناها كما يجب.

بنية تحتية عالية المواصفات

AMD EPYC من أحدث جيل، تخزين NVMe فقط، ذاكرة DDR5، روابط 40 Gbps. ريادة في أداء النواة الواحدة في كل فئة خطة.

تجربة بلا مخاطر

ضمان استرداد خلال 14 يومًا على كل خطة. بلا أسئلة. بلا رسوم إعداد. إلغاء في أي وقت من لوحة التحكم.

اتفاقية وقت تشغيل 99.95%

مراقبة آلية عبر 13 منطقة. اتفاقية مستوى الخدمة لآخر 30 يومًا متاحة علنًا على status.cloudzy.com، بلا إخفاء.

دعم بشري على مدار الساعة

ردود الدردشة المباشرة والتذاكر عادةً في أقل من 5 دقائق. مهندسون، لا قارئو سكربتات. متوسط الحل أقل من ساعة.

أدوات ذكاء اصطناعي يمكنك استضافتها بنفسك

Open-weight models, your infrastructure.

شغّل أي نموذج مفتوح الأوزان أو إطار عمل للذكاء الاصطناعي. وصول root الكامل يعني أنك تختار الحزمة والنموذج وطبقة الخدمة. لا حاجة لمفاتيح API من أطراف خارجية.

Ollama
خدمة نماذج LLM بأمر واحد
llama.cpp
استدلال محسّن لـ CPU
vLLM
خدمة عالية الإنتاجية
Open WebUI
واجهة محادثة لـ LLMs
LangChain
إطار عمل التنسيق
Hugging Face
مركز النماذج + Transformers

حالات الاستخدام

لماذا يختار المطورون
بديل ChatGPT الخاص بـ Cloudzy.

بديل ChatGPT الخاص

شغّل Llama 3 أو Mistral أو Phi على خادمك الخاص مع Open WebUI. واجهة محادثة، سجل المحادثات، ولا تخرج أي بيانات من VPS.

خلفية API لتطبيقك

شغّل LLM خلف REST API الخاص بك. لا فوترة لكل رمز، ولا حدود للطلبات. اربطه بـ SaaS أو بوت أو أداة داخلية.

الضبط الدقيق والتجارب

ارفع مجموعات البيانات، واضبط محولات LoRA دقيقاً، ونفّذ عمليات التقييم. تخزين NVMe الدائم يضمن بقاء نقاط التفتيش بعد إعادة التشغيل.

خادم خط أنابيب RAG

ادمج LLM محلياً مع قاعدة بيانات متجهية (Chroma أو Qdrant أو Weaviate) لتوليد معزَّز بالاسترجاع. كل شيء على جهاز واحد.

مقارنة نماذج متعددة

شغّل Llama وMistral وPhi جنباً إلى جنب. قارن المخرجات والكمون والجودة قبل الاستقرار على نموذج واحد في الإنتاج.

مساعد برمجة بالذكاء الاصطناعي

استضف Code Llama أو DeepSeek Coder بنفسك وصله بـ IDE عبر API محلي. إكمال تلقائي ومحادثة دون إرسال الكود خارجياً.

60s
التهيئة
40 Gbps
ربط صاعد
NVMe فقط
التخزين
13
المناطق
99.95%
اتفاقية مستوى وقت التشغيل
14 days
استرداد المبالغ

شبكة عالمية

13 منطقة. أربع قارات.
على بُعد نقرة واحدة.

ضع بديل ChatGPT الخاص بك VPS أقرب ما يمكن فيزيائياً من مستخدميك. متوسط زمن الاستجابة P50 أقل من 10 ms في أمريكا الشمالية وأوروبا.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

الأسعار

ادفع مقابل ما تستخدمه فقط. هذا كل شيء.

بالساعة أو الشهر أو السنة. لا رسوم خروج. لا التزامات. حاليًا خصم ٥٠٪ جميع الخطط.

512 MB DDR5

نماذج صغيرة · اختبارات

$2.48 /mo
$4.95/mo −50%
انشر الآن
استرداد خلال 14 يومًا
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • IPv4 + IPv6 مخصص
  • Root SSH · KVM
2 GB DDR5

LLMs صغيرة · معاملات 7B

$7.475 /mo
$14.95/mo −50%
انشر الآن
استرداد خلال 14 يومًا
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • IPv4 + IPv6 مخصص
  • Root SSH · KVM
8 GB DDR5

نماذج +13B · مكدسات RAG

$26.475 /mo
$52.95/mo −50%
انشر الآن
استرداد خلال 14 يومًا
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • IPv4 + IPv6 مخصص
  • Root SSH · KVM

الأسئلة الشائعة — ChatGPT VPS

أسئلة شائعة، إجابات مباشرة.

هل يمكنني تشغيل ChatGPT على VPS الخاص بي؟

ChatGPT بحد ذاته خدمة خاصة بـ OpenAI، لكن يمكنك استضافة بدائل مفتوحة الأوزان مثل Llama 3 وMistral وPhi وDeepSeek على VPS الخاص بـ Cloudzy. أدوات مثل Ollama وOpen WebUI توفر تجربة محادثة مماثلة مع الخصوصية الكاملة.

كم أحتاج من RAM لتشغيل استنتاج LLM؟

يعتمد ذلك على حجم النموذج. نموذج بـ 7 مليارات معامل (مثل Llama 3 8B المضغوط) يعمل بـ 4-8 GB من RAM. نموذج 13B يحتاج إلى 8-16 GB. النماذج الأكبر بحجم 70B تحتاج إلى 32-64 GB. ابدأ بخطة 4 GB للنماذج الصغيرة وزد الموارد حسب الحاجة.

هل GPU ضروري لتشغيل LLM؟

لا. أدوات مثل llama.cpp وOllama مُحسَّنة للاستنتاج عبر CPU على AMD EPYC. ستكون سرعة توليد الرموز أبطأ مقارنةً بـ GPU، لكن للاستخدام الشخصي أو الفرق الصغيرة أو المهام الدُّفعية غير المتزامنة، يؤدي CPU الغرض بكفاءة وبتكلفة أقل بكثير من استضافة GPU.

هل يمكنني استضافة عدة نماذج في آنٍ واحد؟

نعم. بقدر كافٍ من RAM، يمكنك تشغيل عدة نماذج عبر Ollama أو vLLM والتبديل بينها. يُحمَّل كل نموذج في الذاكرة عند الطلب. خطة 16 GB تستطيع بسهولة خدمة 2-3 نماذج صغيرة في وقت واحد.

ماذا عن خصوصية البيانات؟

كل شيء يبقى على VPS الخاص بك. لا تُرسَل أي بيانات إلى API تابعة لجهات خارجية. أنت تتحكم في النموذج والبيانات والشبكة. هذه هي الميزة الرئيسية على خدمات الذكاء الاصطناعي المُستضافة: مدخلاتك وردود النموذج لا تغادر خادمك أبداً.

كيف أثبِّت Ollama؟

أمر واحد: curl -fsSL https://ollama.ai/install.sh | sh. ثم حمِّل نموذجاً بالأمر ollama pull llama3 وابدأ المحادثة. تستغرق العملية بأكملها أقل من 5 دقائق على VPS جديد.

هل يمكنني كشف LLM كـ API؟

نعم. Ollama يوفر API متوافقة مع OpenAI على المنفذ 11434 افتراضياً. كذلك vLLM يُتيح نقطة نهاية متوافقة مع OpenAI. وجِّه تطبيقك أو بوتك أو واجهتك الأمامية إلى عنوان IP ومنفذ VPS الخاص بك.

ما ضمان وقت التشغيل؟

تُقدِّم Cloudzy ضمان SLA بنسبة 99.95% عبر جميع الخطط. يبقى خادم الذكاء الاصطناعي الخاص بك متاحاً على مدار الساعة بفضل مسارات شبكة مكررة واتصالية بسرعة 40 Gbps.

هل يمكنني ضبط النماذج الدقيق على هذا VPS؟

الضبط الدقيق عبر CPU ممكن لكنه بطيء. لضبط LoRA/QLoRA للنماذج الصغيرة (7B)، تناسب خطة CPU ذات RAM العالي أغراض التجريب. أما للضبط الدقيق في بيئة الإنتاج للنماذج الكبيرة، فإن حالات GPU أكثر عملية.

ما هي سياسة استرداد الأموال؟

ضمان استرداد المبلغ خلال 14 يوماً دون أي أسئلة. اختبر إعداد الذكاء الاصطناعي، وقِس سرعة الاستنتاج، ثم قرِّر. استرداد كامل من لوحة التحكم أو عبر الدعم الفني.

جاهزون متى أردت.
خادم ذكاء اصطناعي في 60 ثانية.

لا حاجة لبطاقة ائتمان · ضمان استرداد خلال 14 يومًا · إلغاء في أي وقت