ينتقل DLSS من Nvidia إلى Vision Transformer: ما هو وماذا يتغير؟

يتحسن DLSS 4 في العديد من الجوانب هذا العام، ونحن ندين بهذا التطور الكبير لميزة رئيسية جديدة: اعتماد نموذج Transformer. نشرح لك كيف تحقق تقنية Nvidia قفزة أخرى للأمام.

نفيديا

استفادت Nvidia من الإعلان عن بطاقاتها الرسومية التاليةجيفورس ار تي اكس 50للكشف عندي إل إس إس 4، الإصدار الرئيسي الجديد من صندوق أدوات الذكاء الاصطناعي الخاص به لزيادة أداء ألعابك. لم نعد نتحدث عن الدقة الفائقة (أو الارتقاء)، ولكن أيضًا عن إنشاء الصور وإعادة بناء الأشعة.

لقد كان Bryan Catanzaro، الرجل الكبير في التعلم العميق في Nvidia، هو الذي أعلن: هذا هو التحديث الأكثر أهمية لـ DLSS منذ عام 2020. تكمن الأخبار الكبيرة في اعتماد نموذج جديد تمامًا، Vision Transformer. نفسر كيف يعمل وقبل كل شيء كيف يغير الوضع بالنسبة لـDLSS.

حتى الآن، استغلت DLSS الشبكة العصبية التلافيفية أو CNN (الشبكة العصبية التلافيفية)، التي تعمل على أساس التجميع المحلي للبيانات، من خلال تحليل مناطق محددة من الصورة عبر عدة صور متتالية. وهذا أيضًا هو الاختيار الذي اعتمدته شركة Sony لتقنيتهاPSSRعلىPS5 بروبالإضافة إلى قاعدة عمل Project Amethyst لجهاز PS6 المستقبلي.

يعتمد DLSS 4 الآن نموذج Vision Transformer الأحدث بكثير، استنادًا إلى نموذج Transformer المستخدم في تطبيقات مثل ChatGPT أو حتى Sora، الذكاء الاصطناعي المولد للفيديو من OpenAI. يستخدم هذا النموذج الجديد ما يسمى بآلية الانتباه الذاتي، والتي يمكنها تقييم أهمية كل بكسل داخل الصورة نفسها، دائمًا على عدة صور متتالية. يتيح ذلك لـ DLSS 4 الحصول على فهم أفضل للمشاهد ثلاثية الأبعاد الأكثر تعقيدًا من خلال التركيز على التفاصيل والعناصر الأكثر تعقيدًا لإعادة بنائها بالتعريف الأصلي لشاشتك.

يتم تقسيم الصورة إلى مناطق (بقع) لفهم نسبي أفضل للعناصر التي تتكون منها // المصدر:ليوايهيرتز

وفقًا لبريان كاتانزارو خلال مؤتمر صحفي حضره Frandroid في CES في لاس فيغاس، فإن نموذج Transformer هو "أكثر استقرارا» ويمكن "أن يتم تدريبهم على مجموعات بيانات أكبر بكثير". إذا كان أكثر كفاءة في استخدام الطاقة، فهذا يسمح لـ Nvidia بمضاعفة قوة الحوسبة الخاصة بها أربع مرات مقارنة بالإصدارات السابقة. وبالنسبة للاعبين، الفوائد عديدة.

ما يجلبه هذا النموذج الجديد

من خلال استغلال نموذج يمكنه تحليل المناطق الأكثر تعقيدًا في الصورة لتركيز قوتها الحاسوبية هناك، يمكن لـ DLSS 4 نظريًا التغلب على بعض قيود التكنولوجيا. جميع جوانب DLSS معنية: الدقة الفائقة، وإنشاء الإطارات، وإعادة بناء الشعاع، وحتى DLAA، وهو حل منع التعرج من Nvidia.

لقد أظهرت لنا العروض التوضيحية المختلفة لـ Nvidia في الواقع ظواهر الوميض أو الظلال التي تم التخلص منها أحيانًا على عناصر مثل الشوايات أو المراوح فيآلان ويك 2وآخرونالسقاطة والقعقعة: الصدع وبصرف النظر. بشكل عام، يمكننا بالتالي أن نتوقع استقرارًا زمنيًا أفضل للصورة في المشاهد الأكثر تعقيدًا التي سيتم "إعادة بنائها" بواسطة النموذج.

آلان ويك 2 // المصدر: نفيديا

من خلال فهم أفضل للمشهد وعناصره المختلفة، يعمل نموذج Vision Transformer على تحسين إعادة بناء الصورة، أي رفع مستوى التعريف الداخلي إلى التعريف الأصلي لشاشتك. أثناء انتظارنا لنكون قادرين على الاختبار بمزيد من التفاصيل، فقد تمكنا بالفعل من تجربتها في معرض CES في لاس فيغاس، في ألعاب مثلسايبربانك 2077وآخرونآلان ويك 2.

يمكن أن تتحسن جودة الأنسجة اعتمادًا على اللعبة، مع تنشيط إعادة بناء الشعاع // المصدر:المسبك الرقمي

يبدو أن جودة الصورة الإجمالية، خاصة في سيناريوهات تتبع الأشعة وتتبع المسار، قد حققت قفزة إلى الأمام. في هذا السياق، تكتسب أوضاع الأداء والأداء الفائق الوضوح، وهو أمر مفيد جدًا للألعاب الأكثر تطلبًا. أثناء انتظار التمكن من الاختبار بمزيد من التفاصيل، يسمح نموذج Transformer لـ DLSS من Nvidia بالبقاء في المقدمة بشكل كبير على منافسيها، على الرغم من وجودFSR4واعدة من AMD.


عرضنا على Twitch SURVOLTÉS، كل يوم أربعاء من الساعة 5 مساءً حتى 7 مساءً: قابلنا للحديث عن السيارات الكهربائية أو الدراجات الكهربائية، حول المناقشات والمقابلات والتحليلات والألعاب!