تخطَّ إلى المحتوى الرئيسي
خصم ٥٠٪ جميع الخطط، لفترة محدودة. تبدأ من $2.48/mo
20 min left
الذكاء الاصطناعي وتعلم الآلة

What Is Neural Rendering? How AI Is Replacing the Graphics Pipeline

S بواسطة Sherwin 20 دقيقة قراءة
Diagram showing the spectrum of neural rendering techniques from scene reconstruction to real-time pipeline components to generative methods, with the Cloudzy logo

عندما عرضت NVIDIA تقنية DLSS 4 وهي تولّد خمسة عشر من كل ستة عشر بكسلاً بالذكاء الاصطناعي، لم يرَ شريحة كبيرة من الجمهور تقدماً. بل رأوا "إطارات مزيّفة" و"رداءة الذكاء الاصطناعي": تفاصيل مولّدة تبدو صحيحة إلى أن تتوقف عن ذلك، ولا يمكنك تصحيحها كما تصحّح مضلّعاً في غير موضعه. وجد تقرير من PCGuide حول استطلاع مجتمعي أن 54% من الردود كانت "لا" صريحة بشأن مظهر DLSS 5، مع توجيه معظم الانتقادات إلى ملامح الوجه ورد فعل "رداءة الذكاء الاصطناعي". هذا رد فعل يستحق أن نأخذه على محمل الجد، وسنعود إليه.

لكن المشكلة الأكبر في كل واحدة من تلك النقاشات هي أن "التصيير العصبي" يُستخدم لما لا يقل عن خمسة أشياء مختلفة: رفع الدقة، والإطارات المولّدة بالذكاء الاصطناعي، وإعادة بناء المشهد من الصور، وعروض NeRF و Gaussian Splatting التي رأيتها على وسائل التواصل الاجتماعي، وأنظمة الأبحاث التي تصيّر صورة كاملة بشبكة واحدة. يتجادل الناس دون أن يلتقوا لأن كلاً منهم يشير إلى طبقة مختلفة بينما يستخدم الكلمة نفسها. وصف Jensen Huang من NVIDIA هذا التحول بأنه "لحظة GPT للرسوميات". هذا هو الادعاء. والسؤال المفيد هو ما الذي يحدث تحته.

إليك الخيط الناظم الذي يجعل الأمر كله مفهوماً: تتجه وحدة معالجة الرسوميات على نحو متزايد إلى التنبؤ بالصورة بدلاً من حسابها. تقليدياً، تحسب وحدة معالجة الرسوميات كل بكسل عبر محاكاة الأشكال الهندسية والإضاءة والخامات (التنقيط، ومؤخراً تتبّع الأشعة فوقه). يغيّر التصيير العصبي ما الذي يُحسب مقابل ما الذي يُتنبأ به بواسطة شبكة مدرَّبة. هذا التمييز الوحيد هو العمود الفقري لهذا المقال. بحلول النهاية ستتمكن من وضع أي تقنية على طيف، ومعرفة أي منها يعمل في الزمن الحقيقي وعلى أي عتاد، والتمييز بين ما هو متاح في لعبة اليوم وما هو ورقة بحثية أو عرض في GTC. هذه خريطة، وليست دليل كيفية. أما الآليات العميقة لأي تقنية بمفردها فهي مقالات قائمة بذاتها.

النسخة المختصرة

  • التصيير العصبي طيف، وليس مرادفاً لـ DLSS. وهو يمتد من أبحاث إعادة بناء المشهد (NeRF و Gaussian Splatting)، إلى مكوّنات الزمن الحقيقي التي تقع داخل خط أنابيب التصيير (DLSS و Ray Reconstruction وذاكرة الإشعاع العصبية)، إلى الطرق التوليدية التي تبتكر تفاصيل لم يمتلكها الإطار قط.
  • الخيط الناظم هو "تنبّأ بدلاً من أن تحسب". تستبدل كل تقنية مرحلة حسابية مكلفة من خط الأنابيب بشبكة تتنبأ بالنتيجة التي دُرّبت عليها.
  • معظم ما يُطرح اليوم هجين. يعمل رفع الدقة وتوليد الإطارات وإزالة الضوضاء بالذكاء الاصطناعي في ألعاب الزمن الحقيقي الآن، بينما يبرز ضغط الخامات العصبي والمظلّلات العصبية عبر أدوات المطورين. أما أجهزة التصيير العصبية الكاملة التي ترسم الصورة بأكملها بشبكة فما زالت في مرحلة الأبحاث.
  • إنه يصبح متعدد المورّدين، لا مجرد قصة NVIDIA. بدأ عمل Microsoft في DirectX على التعلم الآلي على مستوى المظلّل بـ Cooperative Vectors في Shader Model 6.9، وهو يتجه نحو دعم أوسع للجبر الخطي في Shader Model 6.10، مما يمنح المحركات مساراً لاستهداف أعباء عمل المظلّلات ذات الطابع العصبي خارج حزمة مورّد واحد.

لماذا يعني "التصيير العصبي" خمسة أشياء مختلفة

التصيير العصبي فئة من الطرق التي تستخدم الشبكات العصبية للتنبؤ بأجزاء من صورة (البكسلات والإضاءة والخامات، بل وإطارات كاملة) كانت وحدة معالجة الرسوميات لتحسبها من الصفر لولا ذلك. مسح Tewari وزملائه يعرّفه بأنه دمج رسوميات الحاسوب الكلاسيكية مع نماذج توليدية عميقة للحصول على مخرجات واقعية. ويمتد المصطلح عبر طيف واسع، و"DLSS" نقطة واحدة عليه.

السبب في أن النقاش فوضوي هو أن الطيف يضم ثلاث طبقات متمايزة على الأقل، بينما يستخدم الجمهور كلمة واحدة لها جميعاً.

الطبقة الأولى هي التصيير العصبي الأكاديمي / لإعادة البناء: NeRF و 3D Gaussian Splatting والتصيير القابل للاشتقاق. تأخذ هذه صوراً أو قياسات لمشهد حقيقي وتتعلم تمثيلاً يمكنك التصيير منه من زوايا كاميرا جديدة. ورقة NeRF الأصلية (Mildenhall وزملاؤه، 2020) تدرّب شبكة صغيرة لربط إحداثي ثلاثي الأبعاد واتجاه نظر باللون والكثافة، ثم تصيّر مشاهد جديدة باستعلامها. هذه الطبقة في معظمها غير متصلة. إنها تعيد بناء المشاهد؛ ولا تشغّل حلقة إطارات لعبتك.

الطبقة الثانية هي التصيير العصبي ضمن خط أنابيب الزمن الحقيقي: شبكات تعمل داخل إطار منقّط عادي أو بجانبه. رفع الدقة عبر DLSS و Ray Reconstruction وذاكرة الإشعاع العصبية تقع هنا. لا يزال خط الأنابيب ينقّط ويتتبّع الأشعة؛ تتولى شبكة مرحلة مكلفة واحدة منه. هذه هي الطبقة المتاحة في الألعاب اليوم.

الطبقة الثالثة هي التصيير العصبي التوليدي: تنتج الشبكة محتوى صورة لم يحسبه الإطار قط على الإطلاق. تقع الإطارات المولّدة في DLSS 4 على حافة هذا، ويمضي DLSS 5 (الذي أعلنته NVIDIA لخريف 2026) أبعد فيه بتوليد تفاصيل الإضاءة والخامة بدلاً من مجرد الاستيفاء بين الإطارات المصيَّرة.

تتصرف هذه الطبقات الثلاث على نحو مختلف، وتعمل بسرعات مختلفة، وتحتاج إلى عتاد مختلف. ومعاملتها كشيء واحد هي السبب في أن شخصين يمكن أن يقول أحدهما "التصيير العصبي مبالَغ في الترويج له" والآخر "التصيير العصبي هو المستقبل"، ويكون كلاهما محقاً جزئياً.

خلاصة القسم: المصطلح أقدم من DLSS وليس مرادفاً له. DLSS تطبيق واحد (زمن حقيقي، ضمن خط الأنابيب) داخل طيف أوسع بكثير يمتد من إعادة بناء المشهد دون اتصال إلى إطارات مولّدة بالكامل.

كيف يستبدل التصيير العصبي أجزاءً من خط أنابيب القوة الغاشمة

Timeline of neural rendering milestones from 2018 DLSS 1.0 to 2026 DLSS 5, showing how each stage moved from compute to predict

مع توليد الإطارات المتعدد الكامل في DLSS 4، يكون نحو خمسة عشر من كل ستة عشر بكسلاً على الشاشة من إنتاج الذكاء الاصطناعي بدلاً من تصييرها تقليدياً (وفقاً لأرقام NVIDIA لـ DLSS 4). هذا الرقم هو التحول كله مضغوطاً في إحصائية واحدة: يحسب جهاز التصيير جزءاً يسيراً من الصورة ويتنبأ بالباقي.

يكسب التصيير التقليدي كل بكسل بجهد. تنقّط وحدة معالجة الرسوميات الأشكال الهندسية، وتشغّل المظلّلات لحساب الإضاءة والخامات، و(مع تتبّع الأشعة) تحاكي ارتداد الضوء في أنحاء المشهد. وتتبّع الأشعة على وجه الخصوص مكلف على نحو وحشي، لأن الضوء الواقعي يحتاج إلى ارتدادات كثيرة وعينات كثيرة لكل بكسل، ويتعين تنظيف الضوضاء الناتجة عن نقص العينات بعد ذلك. ومع ازدياد طموح المشاهد، صارت أكثر المراحل تكلفة هي الأهداف البديهية: بدلاً من حسابها، درّب شبكة للتنبؤ بمخرجاتها.

كان التقدم ثابتاً لا مفاجئاً:

  • 2018، DLSS 1.0. الخطوة التجارية الأولى: صيّر بدقة منخفضة، وتنبّأ بالصورة عالية الدقة. انقل رفع الدقة من "احسب مزيداً من البكسلات" إلى "تنبّأ بمزيد من البكسلات".
  • 2020، NeRF. إعادة بناء المشهد من الصور عبر حقل إشعاع متعلَّم. تنبّأ بمشاهد جديدة بدلاً من نمذجة الأشكال الهندسية وتصييرها.
  • 2021، ذاكرة الإشعاع العصبية. تنبّأ بالضوء المرتد أثناء تتبّع المسار حتى يستطيع جهاز التصيير إيقاف التتبّع مبكراً.
  • 2022، توليد الإطارات في DLSS 3. ولّد إطارات وسيطة كاملة بدلاً من تصييرها.
  • 2023، 3D Gaussian Splatting. بديل أسرع وأميل إلى الزمن الحقيقي لـ NeRF للمشاهد المعاد بناؤها.
  • 2025، DLSS 4 + RTX Kit. توليد الإطارات المتعدد إلى جانب مجموعة أدوات من المكوّنات العصبية (ضغط الخامات، وذاكرة الإشعاع، والمظلّلات العصبية).
  • 2025، DirectX Cooperative Vectors (معاينة). واجهة برمجة تطبيقات متعددة المورّدين لحسابات المصفوفات التي تحتاجها المظلّلات العصبية (طُرحت كمعاينة ضمن Shader Model 6.9).
  • 2026، DLSS 4.5. تحسينات تدريجية في الجودة وفي Ray Reconstruction (وصفتها NVIDIA في Computex).
  • خريف 2026، DLSS 5 (مُعلَن). الدفعة التالية نحو التصيير العصبي التوليدي.

إذا قرأته من الأعلى إلى الأسفل، فكل صف هو الخطوة نفسها مطبَّقة على مرحلة مختلفة: خذ شيئاً اعتاد خط الأنابيب أن يحسبه واجعل شبكة تتنبأ به بدلاً من ذلك.

الطبقات الست: ما الذي يستبدله الذكاء الاصطناعي في كل مرحلة من خط الأنابيب

Diagram of the six neural rendering techniques mapped to where they run in the graphics pipeline: AI upscaling, frame generation, ray reconstruction, neural radiance cache, neural texture compression, and neural shaders

تحمل ست تقنيات معظم التصيير العصبي للزمن الحقيقي اليوم، وكل واحدة منها تستبدل مرحلة حسابية محددة: رفع الدقة (الدقة)، وتوليد الإطارات (عدد الإطارات)، و ray reconstruction (إزالة الضوضاء)، وذاكرة الإشعاع العصبية (الإضاءة الشاملة)، وضغط الخامات العصبي (تخزين الخامات)، والمظلّلات العصبية (الحساب داخل المظلّل). ومعرفة أي مرحلة تمسّها كل واحدة هي معظم المعركة.

تنقسم هذه بحسب أين تعمل الشبكة في خط الأنابيب. بعضها يعمل في النهاية تماماً كمعالجة لاحقة على إطار منجَز؛ وبعضها يعمل في منتصف خط الأنابيب إلى جانب تتبّع الأشعة؛ وبعضها يقطن داخل المظلّل نفسه. هذا الموقع ليس تفصيلاً. إنه يحدد مدى سرعة عمل التقنية والعتاد الذي تحتاجه. يرسم الجدول خريطة لتلك التقنيات الست؛ وتشرح الأقسام الفرعية أدناه الآلية التي لم تكن لتتسع بإحكام في كل خلية.

التقنية ما الذي تستبدله جدوى الزمن الحقيقي العتاد المطلوب متعددة المورّدين؟
رفع الدقة بالذكاء الاصطناعي (super resolution) حساب بكسلات الدقة الأصلية زمن حقيقي، حِمل إضافي منخفض أنوية Tensor / المصفوفات (RTX 20+ و RDNA 4 و Intel XMX) نعم كفئة؛ لكن التطبيقات تبقى خاصة بكل مورّد (DLSS و FSR / FSR Upscaling و XeSS)
توليد الإطارات تصيير الإطارات الوسيطة زمن حقيقي؛ يضيف زمن استجابة RTX 40+ (DLSS 3)، و RTX 50 للإطارات المتعددة جزئياً؛ خاصة بكل مورّد
Ray reconstruction حزمة مزيلات الضوضاء المضبوطة يدوياً زمن حقيقي RTX 20+ NVIDIA اليوم
ذاكرة الإشعاع العصبية حساب الضوء غير المباشر متعدد الارتدادات زمن حقيقي (نحو 2.6 ms حسب التقارير) أنوية مصفوفات من فئة RTX NVIDIA اليوم (RTX Kit)
ضغط الخامات العصبي تخزين الخامات المضغوط بالكتل فك ترميز في الزمن الحقيقي أنوية مصفوفات من فئة RTX عُدّة/أدوات NVIDIA اليوم؛ ويجري توحيد دعم أوسع للتعلم الآلي على مستوى المظلّل بشكل منفصل
المظلّلات العصبية مسارات شيفرة المظلّل المحسوبة زمن حقيقي تعلّم آلي على مستوى المظلّل / وحدات معالجة رسوميات قادرة على المصفوفات يبرز عبر مسار DirectX SM 6.9 / SM 6.10

رفع الدقة بالذكاء الاصطناعي (Super Resolution)

يصيّر رفع الدقة بالذكاء الاصطناعي الإطار بدقة أقل ويتنبأ بالنتيجة عالية الدقة، فترسم وحدة معالجة الرسوميات بكسلات أقل بكثير وتملأ شبكة البنية. وتقوم DLSS و FSR 4 من AMD و XeSS من Intel بهذا جميعها عبر الزمني رفع العينات الزمني: تأخذ عينات من بكسلات مختلفة عبر إطارات متتالية وتجمع ذلك التاريخ مع متجهات الحركة لإعادة بناء تفاصيل لا يحتويها إطار واحد منخفض الدقة.

هذه أكثر الطبقات نضجاً وأوسعها انتشاراً، وفيها يتضح واقع تعدد المورّدين بأجلى صورة. نقلت DLSS 4 أداة رفع الدقة لديها من شبكة التفافية إلى محوّل (transformer) لتحقيق ثبات أفضل في التفاصيل. و FSR 4 هي أول أداة لرفع الدقة قائمة على التعلم الآلي من AMD، وتعمل على RDNA 4 باستدلال FP8 بدلاً من الاستدلالات المكتوبة يدوياً في إصدارات FSR السابقة. ويستخدم XeSS وحدات مصفوفات XMX من Intel. ثلاثة مورّدين، والفكرة الأساسية ذاتها: تنبّأ بالبكسلات التي لم تصيّرها.

توليد الإطارات وتوليد الإطارات المتعدد

يتنبأ توليد الإطارات بإطارات كاملة بين تلك التي تصيّرها وحدة معالجة الرسوميات فعلياً عبر دمج بيانات اللعبة مثل متجهات الحركة مع تقدير التدفق البصري والذكاء الاصطناعي. استخدمت DLSS 3 مسرّع التدفق البصري في سلسلة RTX 40 لإدراج إطار مولّد واحد بين الإطارات المصيَّرة؛ ويمكن لتوليد الإطارات المتعدد في DLSS 4 على عتاد سلسلة RTX 50 توليد ما يصل إلى ثلاثة إطارات إضافية لكل إطار مصيَّر تقليدياً، وتقول NVIDIA إن DLSS 4 يستبدل خطوة التدفق البصري العتادية بنموذج ذكاء اصطناعي أكثر كفاءة.

هذه هي الطبقة التي يدور حولها جدل "الإطارات المزيّفة" حقاً، وللصياغة هنا أهمية. الإطار المولّد هو استيفاء معقول لما كان المشهد متجهاً إليه: إنه يعرض لك محتوى بصرياً قابلاً للاستخدام. لكنه يُتنبأ به، لا مصيَّراً من الحالة الفعلية للعبة، ولا يحمل منطق لعبة جديداً ولا مدخلات جديدة. والأهم أن توليد الإطارات يعمل بعد تصيير إطار، مما يضيف زمن استجابة بدلاً من إزالته؛ وتوجد Reflex 2 من NVIDIA تحديداً لانتزاع ذلك الزمن. لذا فإن "توليد الإطارات يجعل اللعبة أسرع" حقيقة جزئية: إنه يرفع النعومة المُدرَكة (عدد أكبر من الإطارات المعروضة) دون أن يرفع المعدل الذي تتحدث به اللعبة فعلياً وتستجيب. تلك الفجوة بين ما تراه وما تعرفه اللعبة هي الجدل كله، وفي اللعب التنافسي، حيث يحسم زمن استجابة المدخلات النتائج، فهي مقايضة تستحق الموازنة.

Ray Reconstruction (إزالة الضوضاء بالذكاء الاصطناعي)

تستبدل Ray Reconstruction حزمة مرشّحات إزالة الضوضاء المضبوطة يدوياً التي يعتمد عليها التصيير بتتبّع الأشعة بشبكة عصبية واحدة مدرَّبة لإعادة بناء صورة نظيفة من مدخلات تتبّع أشعة مشوّشة وناقصة العينات. لا يستطيع تتبّع المسار في الزمن الحقيقي تحمّل سوى بضع عينات ضوء لكل بكسل، مما يترك المخرجات الأولية مشوّشة؛ ولا بدّ لشيء أن ينظّفها قبل أن تراها.

كان النهج التقليدي سلسلة من مزيلات الضوضاء المتخصصة، كلٌّ مضبوط يدوياً لتأثير محدد. واستبدال ذلك بشبكة مدرَّبة واحدة يميل إلى الحفاظ على التفاصيل التي طمستها المرشّحات المضبوطة يدوياً، خصوصاً في الانعكاسات والإضاءة الدقيقة، وهي شبكة واحدة لصيانتها بدلاً من خط أنابيب هشّ منها. هذا مثال نقي على الخيط الناظم: انتقلت مرحلة إزالة الضوضاء من "الحساب باستدلالات مكتوبة يدوياً" إلى "التنبؤ بنموذج مدرَّب".

ذاكرة الإشعاع العصبية (الإضاءة الشاملة)

تتنبأ ذاكرة الإشعاع العصبية (NRC) بكيفية ارتداد الضوء في أنحاء المشهد حتى يستطيع متتبّع المسار إيقاف تتبّع معظم الأشعة مبكراً بدلاً من ملاحقة كل ارتداد حتى نهايته. الإضاءة الشاملة (ذلك الضوء الناعم غير المباشر الذي يرتدّ عن الجدران والأرضيات) من أكثر الأشياء تكلفة في رسوميات الزمن الحقيقي، ونادراً ما تُشرح الآلية التي تجعل NRC تعمل بلغة بسيطة، لذا يستحق الأمر أن نتمهل من أجله.

إليك الآلية. يلاحق متتبّع المسار عادةً كل شعاع ضوء عبر ارتدادات كثيرة، وهنا تنفجر التكلفة. تدرّب NRC شبكة صغيرة أثناء التصيير (لا قبله) للتنبؤ بالضوء الواصل إلى نقطة بعد مزيد من الارتدادات. فيتتبّع متتبّع المسار شعاعاً لارتداد أو اثنين، ثم يسأل الشبكة "ما بقية الضوء هنا؟" وينهي المسار مبكراً؛ ورقة التخزين المؤقت للإشعاع العصبي في الزمن الحقيقي (Müller وزملاؤه، 2021) تفيد بإنهاء الغالبية العظمى من المسارات بهذه الطريقة. فكّر فيها كذاكرة مؤقتة لا تخزّن إجابات دقيقة رأتها من قبل، بل تتعلم نمط إضاءة المشهد جيداً بما يكفي للإجابة عن استعلامات لم ترها، وتظل تعيد التعلّم كلما تغيّر المشهد. تفيد NVIDIA بأن NRC تعمل بحِمل إضافي يبلغ نحو 2.6 ms، وهو ما يجعلها قابلة للتطبيق في الزمن الحقيقي لا مجرد طُرفة بحثية.

ضغط الخامات العصبي

يضغط ضغط الخامات العصبي (NTC) جميع قنوات نسيج الخامة معاً بشبكة، محقّقاً وفراً في ذاكرة الفيديو يصل إلى 8 أضعاف مقارنةً بضغط الكتل التقليدي عند جودة بصرية مماثلة (وفقاً لوثائق RTX Kit من NVIDIA). الخامة الحديثة ليست نسيجاً واحداً. إنها كومة منها (اللون والمتجهات الناظمية والخشونة والمعدنية وغيرها)، وتترابط تلك القنوات بطرق يهدرها ضغط الكتل الذي يضغط كل قناة على حدة.

يستغلّ NTC ذلك الترابط. فبتعلّم البنية المشتركة عبر جميع قنوات الخامة دفعةً واحدة، يخزّن الخامة نفسها في ذاكرة أقل بكثير ويفكّ ترميزها آنياً وقت التصيير. وتظل ذاكرة الفيديو قيداً مستمراً مع دفع الألعاب لتفاصيل النسيج، لذا فإن "احتواء 8 أضعاف من الخامة في الذاكرة نفسها" مكسب مباشر وعملي لا حيلة بصرية.

المظلّلات العصبية و DirectX Cooperative Vectors

تشغّل المظلّلات العصبية شبكات عصبية صغيرة داخل مظلّل قابل للبرمجة (البرامج لكل بكسل/لكل رأس التي تنفّذها وحدة معالجة الرسوميات أصلاً) حتى تستطيع شبكة أن تقارب تأثيراً محسوباً مكلفاً تماماً حيث يُحتاج إليه. وبدلاً من إلحاق الذكاء الاصطناعي كمرور منفصل، يعمل الـ MLP كجزء من المظلّل على وحدات المصفوفات في وحدة معالجة الرسوميات (Tensor Cores على عتاد NVIDIA).

تتولى Tensor Cores حسابات المصفوفات التي تعمل عليها هذه الشبكات، وهي متمايزة عن الأنوية عامة الأغراض التي تتولى بقية العمل. والشيء الذي يحوّل المظلّلات العصبية من ميزة لمورّد واحد إلى قدرة صناعية أوسع هو طبقة واجهة برمجة التطبيقات الكامنة تحتها. قدّمت Microsoft تقنية DirectX Cooperative Vectors كمعاينة مع Shader Model 6.9 في 2025 لإتاحة عمليات المتجهات/المصفوفات داخل مظلّلات HLSL. وبحلول 2026، كان Shader Model 6.9 قد انتقل إلى الإصدار الرسمي، وقالت Microsoft إن Cooperative Vector يجري إيقافه لصالح تصميم جبر خطي أوسع مخطَّط له في Shader Model 6.10. والخلاصة الآمنة ليست أن Cooperative Vectors هي الواجهة النهائية، بل أن DirectX يتجه نحو دعم التعلم الآلي متعدد المورّدين على مستوى المظلّل.

خلاصة القسم: تُصنَّف التقنيات الست بحسب أين تعمل الشبكة: معالجة لاحقة في نهاية الإطار، أو في منتصف خط الأنابيب إلى جانب تتبّع الأشعة، أو داخل المظلّل نفسه. وهذا الموقع هو ما يحدد ما إذا كانت التقنية قادرة على العمل في الزمن الحقيقي وأي عتاد تحتاجه.

ما الذي يعمل في الزمن الحقيقي، وعلى أي عتاد

Chart showing real-time viability of neural rendering techniques by hardware requirement, from shipping game features to research-only full neural renderers

خط الزمن الحقيقي أحدّ مما توحي به الضجة: رفع الدقة بالذكاء الاصطناعي يعمل عادةً بحِمل إضافي منخفض، و NRC تضيف نحو 2.6 ms، و 3D Gaussian Splatting يقترب من الزمن الحقيقي للمشاهد الساكنة. أما NeRF الأصلية وأجهزة التصيير العصبية الكاملة مثل RenderFormer فهي بحثية بحتة بقوة، إذ تستغرق وقتاً أطول بكثير لكل إطار من أن يصلح للاستخدام التفاعلي. عبارة "التصيير العصبي زمن حقيقي" صحيحة للطبقة ضمن خط الأنابيب وخاطئة لطبقتي إعادة البناء والتصيير الكامل.

هذا التقسيم يتبع الطيف بدقة. بعض المكوّنات ضمن خط الأنابيب، خصوصاً رفع الدقة وتوليد الإطارات و Ray Reconstruction، تعمل فعلاً في ألعاب مطروحة. أما غيرها، مثل NRC و NTC والمظلّلات العصبية، فالأفضل وصفها بأنها تقنيات للمطورين وميزات أدوات ناشئة، لا ميزات إنتاجية شائعة. وطبقة إعادة البناء خليط متفاوت: NeRF الأصلية بطيئة، لكن 3D Gaussian Splatting كان دفعة متعمَّدة نحو الزمن الحقيقي وهو يبلغه للمشاهد الساكنة. أما طبقة التصيير العصبي الكامل (شبكة واحدة تنتج الصورة بأكملها) فهي حيث تقطن الأبحاث وأزمنة الإطارات فيها أبعد ما تكون عن التفاعلية.

العتاد هو النصف الآخر من الإجابة، وهنا تحطّ قصة تعدد المورّدين. كل تقنية هنا تعمل على وحدات حسابات المصفوفات التي تأتي بها وحدات معالجة الرسوميات الحديثة لاستدلال الذكاء الاصطناعي:

  • NVIDIA لديها Tensor Cores في كل بطاقة RTX اعتباراً من سلسلة 20 فصاعداً، ولهذا ظهرت معظم هذه التقنيات لأول مرة هناك.
  • أما فإن رفع الدقة FSR القائم على التعلم الآلي من AMD يستهدف حالياً وحدات معالجة الرسوميات RDNA 4 / Radeon RX سلسلة 9000 لمسار التعلم الآلي؛ وعلى العتاد الأقدم، تتراجع عُدّة تطوير AMD إلى مسارات FSR 3.1.5 التحليلية. عامِل الدعم الأوسع لوحدات الرسوميات الأقدم كبند خارطة طريق متحرّك، لا كميزة FSR 4 مضمونة ما لم تستشهد بإعلان محدد من AMD.
  • Intel تستخدم محرّكات مصفوفات XMX على وحدات معالجة الرسوميات Arc لأجل XeSS.

DLSS نفسها مقيَّدة الميزات بحسب الجيل: يعمل رفع الدقة رجوعاً إلى سلسلة RTX 20، ويحتاج توليد الإطارات الأصلي إلى سلسلة RTX 40، وتوليد الإطارات المتعدد حصري لسلسلة RTX 50. وإذا كنت تحاول استنتاج ما تقدر عليه بطاقة معيّنة، فإن ذلك التقييد بحسب الجيل هو الإجابة العملية، لا الفئة التسويقية.

ما يمكنك استخدامه اليوم مقابل ما هو قادم: رفع الدقة وتوليد الإطارات و Ray Reconstruction متاحة في الألعاب اليوم. مكوّنات RTX Kit مثل NRC و NTC والمظلّلات العصبية متاحة كتقنيات وأدوات للمطورين، لكن لا ينبغي أن توحي بأنها جميعاً شائعة بالفعل في الألعاب المطروحة. ولدى Gaussian Splatting أدوات مفتوحة قابلة للاستخدام لالتقاط المشاهد. أما ما لم يصل بعد فهو: أجهزة التصيير العصبية الكاملة التي ترسم إطاراً كاملاً بشبكة واحدة، والمظلّلات العصبية الناضجة متعددة المورّدين (دعم AMD مبكر)، والميزات التوليدية في DLSS 5 (المُعلَنة لخريف 2026). وإن أردت أن تجرّب جانب إعادة البناء (تشغيل NeRF أو أعباء استدلال بنفسك)، فتلك مهمة حوسبة وحدة معالجة الرسوميات ، لا شيئاً تفعله لعبتك نيابةً عنك.

ما ليس هو التصيير العصبي: خمسة مفاهيم خاطئة

Visual summary of five common neural rendering misconceptions and the clarifications that resolve each one

تصبح معظم نقاشات التصيير العصبي أسهل بمجرد أن تحدّد أي طبقة من الطيف يتعلق بها الادعاء. وتتكرر خمسة مفاهيم خاطئة مراراً وتكراراً.

1. "رفع الدقة عبر DLSS هو التصيير العصبي." DLSS هي an تطبيق للتصيير العصبي، أي الطبقة ضمن خط الأنابيب في الزمن الحقيقي، لا المجال بأكمله. فالمصطلح أقدم من DLSS ويشمل NeRF و Gaussian Splatting والطرق التوليدية. ومساواة الاثنين أشبه بتسمية "قواعد البيانات" مرادفاً لمنتج واحد تصادف أنك تستخدمه.

2. "توليد الإطارات يجعل الألعاب أسرع." إنه يرفع عدد الإطارات التي تراها، مما يجعل الحركة تبدو أنعم، لكنه يعمل بعد التصيير ويضيف زمن استجابة. أما المعدل الذي تتحدث به اللعبة وتستجيب لمدخلاتك فلا يزداد. ففي اللعب التنافسي يكون ذلك الزمن مقايضة حقيقية؛ وللنعومة البصرية يكون مكسباً صريحاً. وكلمة "أسرع" تخلط بين الاثنين.

3. "DLSS 5 مدرِكة للأبعاد الثلاثية / تقرأ المشهد ثلاثي الأبعاد." هذا أكثرها استحقاقاً لأن نفهمه على نحو صحيح، لأن التغطية التقنية لا تنفك تصفه وصفاً خاطئاً. كما تصفه NVIDIA، تأخذ DLSS 5 بيانات اللون ومتجهات الحركة لكل إطار كمدخلات، ثم تستخدم نموذجها المدرَّب لاستنتاج دلالات المشهد مثل الشخصيات والشعر والقماش والجلد وظروف الإضاءة. وهي مستندة إلى محتوى اللعبة، لكن NVIDIA لا تصفها بأنها تقرأ ملف المشهد ثلاثي الأبعاد الكامل للعبة مباشرةً. وتعني "موجَّهة بالأبعاد الثلاثية" أن الاستنتاج متسق هندسياً (يراعي كيف تتحرك الأسطح وتترابط)، لا أن الشبكة تقرأ هندسة المشهد مباشرةً. وهذا التمييز مهم لأنه يحدّ مما تستطيع التقنية معرفته وما لا تستطيع.

4. "NeRF صارت زمناً حقيقياً الآن." يعتمد على أي تقنية تقصد، وهذه بالضبط مشكلة الطيف. NeRF الأصلية ليست زمناً حقيقياً. و 3D Gaussian Splatting يقترب من الزمن الحقيقي للمشاهد الساكنة. أما أنظمة الأبحاث التي تصيّر إطاراً كاملاً بشبكة واحدة (RenderFormer وما شابهها) فليست زمناً حقيقياً على الإطلاق. وقد صارت "NeRF" مصطلحاً جامعاً لنصف دزينة من الطرق ذات السرعات شديدة التباين.

5. "التصيير العصبي سيحلّ محل التنقيط قريباً." أنظمة اليوم هجينة: المكوّنات العصبية تقع داخل خط أنابيب تنقيط وتتبّع أشعة، لا محلّه. أما الاستبدال الكامل لخط الأنابيب الكلاسيكي بجهاز تصيير توليدي واحد فهو هدف بحثي بعيد الأمد، لا اتجاه منتج قريب. خذ "المستقبل عصبي بالكامل" كاتجاه سير، لا كتنبؤ مؤرَّخ.

خلاصة القسم: السبب الجذري الأوحد لكل خلاف حول التصيير العصبي تقريباً هو استخدام الناس الكلمة نفسها لطبقات مختلفة من الطيف. حدّد موضع الادعاء على الطيف أولاً، يتلاشَ معظم الجدل.

إلى أين يتجه هذا

المسار متسق مع كل ما سبق: خطوط أنابيب هجينة اليوم، ومزيد من المراحل تنتقل من الحساب إلى التنبؤ، ومظلّلات عصبية متعددة المورّدين توسّع دائرة من يستطيع طرح هذا، وحدود التصيير العصبي الكامل ما زالت على بُعد سنوات. والخطوة الاستهلاكية التالية هي DLSS 5، المُعلَنة لخريف 2026، وهي تمضي في التصيير العصبي التوليدي بإنتاج تفاصيل إضاءة وخامة لم تحسبها اللعبة قط، بدلاً من مجرد الاستيفاء بين الإطارات المصيَّرة. وقد عرضت NVIDIA التقنية في سياقات سلسلة RTX 50، لكن ينبغي معاملة متطلبات العتاد الاستهلاكي النهائية لها كغير مؤكَّدة حتى تنشر NVIDIA قائمة توافق واضحة.

للنظرة المستقبلية شقّان. على الجانب القريب، أهم خطوة ليست أي تقنية بمفردها. بل هي التوحيد القياسي. فمسار DirectX من Microsoft ينتقل من Cooperative Vectors نحو جبر خطي أوسع على مستوى المظلّل، مما قد يتيح للمحركات استهداف أعباء عمل ذات طابع عصبي دون المراهنة على علامة وحدة معالجة رسوميات واحدة. وعلى الجانب البعيد، وصف باحثو NVIDIA نقطة نهاية في مستقبل بعيد، تُطرح أحياناً كـ "DLSS 10" افتراضية، يكون فيها جهاز التصيير عصبياً بالكامل وقد زال خط الأنابيب الكلاسيكي (وردت بطريقة غير مباشرة من طاولة نقاش لـ Digital Foundry؛ عامِلها كاتجاه مُعلَن، لا كخارطة طريق). ونقطة نهاية السُّلَّم هي نظام يولّد عالماً متماسكاً بدلاً من أن يرسم عالماً.

غير أن الإبقاء على الشك جدير بالاهتمام. فالتفاصيل المولّدة قد تنحرف عن النية الفنية، ويمكن لشبكة أن تهلوس مرئيات معقولة لكنها خاطئة لا مكافئ تقليدي لها يمكن تصحيحه: مشكلة ضمان جودة أُشير إليها في GDC 2026، وهي جوهر كثير من رد فعل "رداءة الذكاء الاصطناعي". والبناء لما تتجه إليه الرسوميات لا يعني التظاهر بأن المخرجات الحالية مكتملة. بل يعني مراقبة أي المراحل تنتقل من الحساب إلى التنبؤ تالياً، والحكم على كل واحدة بما تفعله بالصورة لا بالكلمة المعلَّقة عليها.

الأسئلة الشائعة

هل DLSS تصيير عصبي؟

نعم، لكنها نوع واحد فقط. DLSS تطبيق للتصيير العصبي: تحديداً الطبقة ضمن خط الأنابيب في الزمن الحقيقي، وتشمل رفع الدقة بالذكاء الاصطناعي وتوليد الإطارات. والمصطلح الأوسع أقدم من DLSS ويشمل أيضاً طرق إعادة بناء المشهد مثل NeRF و Gaussian Splatting وطرقاً توليدية تبتكر تفاصيل صور جديدة. فكل ميزة في DLSS هي تصيير عصبي، لكن كثيراً من التصيير العصبي ليس DLSS.

ما الفرق بين التصيير العصبي وتتبّع الأشعة؟

تتبّع الأشعة يحاكي الضوء بحساب كيفية ارتداد الأشعة عبر المشهد؛ أما التصيير العصبي يتنبأ بـ فيتنبأ بالنتائج من شبكة مدرَّبة بدلاً من حسابها. وهما ليسا متنافسين. بل يتكاملان. فمثلاً تستخدم Ray Reconstruction شبكة عصبية لإزالة الضوضاء من مخرجات تتبّع الأشعة المشوّشة، وتتنبأ ذاكرة الإشعاع العصبية بالضوء المرتد حتى يستطيع متتبّع الأشعة التوقف مبكراً. التقنيات العصبية تجعل تتبّع الأشعة ميسوراً في الزمن الحقيقي.

هل يضيف توليد الإطارات في DLSS زمن استجابة؟

نعم. يعمل توليد الإطارات بعد تصيير إطار ويدرج إطارات متنبَّأ بها بين الإطارات المصيَّرة، مما يضيف زمن استجابة بدلاً من إزالته: وتوجد Reflex 2 من NVIDIA تحديداً للتعويض. إنه يزيد النعومة المُدرَكة (عدد أكبر من الإطارات المعروضة) دون زيادة مدى سرعة تحديث اللعبة واستجابتها للمدخلات. ففي اللعب التنافسي تكون مقايضة؛ ولنعومة اللعب الفردي تكون عادةً مكسباً صافياً.

هل NeRF زمن حقيقي؟

يعتمد على أي تقنية تقصد. NeRF الأصلية ليست زمناً حقيقياً. و 3D Gaussian Splatting، وهي طريقة لاحقة، يقترب من الزمن الحقيقي للمشاهد الساكنة. أما أجهزة التصيير العصبية الكاملة التي ترسم إطاراً كاملاً بشبكة واحدة فهي بحثية بحتة وبعيدة عن السرعات التفاعلية. وكثيراً ما تُستخدم "NeRF" بتساهل لتشمل عدة طرق ذات أداء شديد التباين، وهو مصدر معظم الالتباس.

هل سيحلّ التصيير العصبي محل التنقيط؟

ليس قريباً. أنظمة اليوم هجينة: تعمل المكوّنات العصبية داخل خط أنابيب تنقيط وتتبّع أشعة، لا بدلاً منه. أما استبدال خط الأنابيب الكلاسيكي بالكامل بجهاز تصيير توليدي واحد فهدف بحثي بعيد الأمد، لا منتج قريب. والاتجاه الواقعي هو انتقال مزيد من مراحل خط الأنابيب من المحسوب إلى المتنبَّأ به بمرور الوقت، مع بقاء التنقيط يؤدي عملاً حقيقياً لسنوات.

ما هو ضغط الخامات العصبي؟

ضغط الخامات العصبي (NTC) طريقة عصبية تضغط جميع قنوات نسيج الخامة معاً (اللون والمتجهات الناظمية والخشونة والبقية)، محقّقاً وفراً في ذاكرة الفيديو يصل إلى 8 أضعاف مقارنةً بضغط الكتل التقليدي عند جودة بصرية مماثلة، وفقاً لـ NVIDIA. وهو يعمل بتعلّم الترابطات عبر القنوات التي يهدرها ضغط الكتل الذي يضغط كل قناة على حدة. وتُفك ترميز الخامة المضغوطة آنياً وقت التصيير.

Share

المزيد من المدونة

تابع القراءة.

جاهز للنشر؟ تبدأ من 2.48 $/شهر.

سحابة مستقلة منذ 2008. AMD EPYC، NVMe، 40 Gbps. استرداد خلال 14 يومًا.