كما هو متوقع، استفادت Nvidia من GTC يوم الثلاثاء لرفع الحجاب عن بنية جديدة: Nvidia Hopper، تكريمًا لـ Grace Hopper. تعد شريحة Nvidia H100 أول من استخدم هذه البنية.
بعد عامين من تقديم بنية Ampere التي حركت ببراعة GeForce RTX 3000 وشرائح السلسلة A لمراكز البيانات وشرائح سلسلة RTX A لأجهزة الكمبيوتر الشخصية الاحترافية، كشفت Nvidia عن بنية جديدة: Hopper.
بنية للمحترفين
في البداية يجب أن نوضح نقطة مهمة. حيث كانت Ampere عبارة عن بنية مصممة لكل من أسواق الألعاب والأسواق الاحترافية، فقد اختارت Nvidia العمل على معماريتين لجيلها الجديد من المنتجات. خلالجي تي سيالثلاثاء مؤتمرها المخصص للمطورين ونفيديا تكشف النقاب عن Hopper للمحترفين وننتظر بداية العام الدراسيبنية Ada Lovelace لـ GeForce RTX 4000.
ومع ذلك، يبقى من المثير للاهتمام اكتشاف الميزات الجديدة التي تقدمها Hopper لمعرفة ما يمكن أن تقدمه Nvidia لعامة الناس في السنوات القادمة.
80 مليار ترانزستور، تصنيع 4 نانومتر
هذا هو الإعلان عن كل التفضيلات لـ Nvidia. قدمت الشركة كلاً من بنية Hopper وشريحة H100، وهي أول من استخدم هذه البنية. شريحة ستظل تجمع 80 مليار ترانزستور، مما يجعلها أكبر وأقوى معجل في العالم، وفقًا لشركة Nvidia. نحن تحت 114 مليار ترانزستور من الشريحةأبل ام 1 الترا، لكن الأخير عبارة عن شركة نفط الجنوب (SoC) التي تدمج العديد من المكونات.
لإنشاء هذه الشريحة، استدعت Nvidia شركة TSMC وعملية التصنيع الجديدة التي تبلغ 4 نانومتر. تذكر أن Nvidia قد اختارت Samsung كشريك تصنيع لرقائق 8nm Ampere. يمكن ربط هذه الشريحة بأحدث جيل من ذاكرة HBM3، مما يسمح بعرض نطاق ترددي يصل إلى 3 تيرابايت/ثانية. مع هذا النطاق الترددي، تعلن Nvidia أن 20 شريحة Hopper H100 كافية لدعم حركة الإنترنت العالمية. ويكفي أن نتصور التطبيقات في مجال الذكاء الاصطناعي على نطاق عالمي وفي الوقت الحقيقي.
عنصر مميز آخر لـ Hopper: الانتقال إلى الجيل الرابع من Nvidia NVLink، والذي يسمح بتوسيع ما يصل إلى 256 شريحة H100 في مركز البيانات، مما يحسن عرض النطاق الترددي حتى 9x مقارنة بالجيل السابق. تعد شريحة H100 أول شريحة تقوم بإدارة PCI Express 5.0 محليًا لزيادة عرض النطاق الترددي على الخوادم التي تستخدم هذا البروتوكول.
في مواجهة Ampere، لا تتردد Nvidia في الإعلان عن تحسين قوة الحوسبة بمقدار 3 إلى 4x للوصول إلى مستويات تجعلك تشعر بالدوار: 4000 TFLOPS في FP8، 2000 TFLOPS في FP16 و60 TFLOPS في FP32/FP64.
محرك محول نفيديا
في قلب بنية Nvidia Hopper، نجد محرك Transformer الذي من المفترض أن يزيد بشكل كبير من قدرات الذكاء الاصطناعي وأداء الشريحة. الاسم هو إشارة مباشرة إلى المحول، وهي تقنية واعدة وذات شعبية متزايدة في مجال الذكاء الاصطناعي. يعتمد Google BERT أو GPT-3 من OpenAI على نموذج المحول. ويستخدم هذا النموذج بشكل متزايد في مجالات الترجمة وتحليل الصور والبحوث الصحية.
من المفترض أن يؤدي تكامل محرك المحولات، وفقًا لـ Nvidia، إلى تسريع الشبكات العصبية الاصطناعية بما يصل إلى 6x مقارنة بالجيل القديم.
عرضت Nvidia العديد من مقارنات الأداء بين الجيل الجديد H100 وشريحة Ampere A100. من خلال توسيع نطاق وحدة معالجة الرسومات التسلسلية، تعد Nvidia بتعزيز الأداء بما يصل إلى تسعة أيام، مما يقلل وقت التدريب من 7 أيام إلى 20 ساعة فقط.
إطلاق في الربع الثالث
سيكون Nvidia Hopper متاحًا للمحترفين بدءًا من الربع الثالث. وقد وقعت الشركة بالفعل مع شركاء رائدين في هذا القطاع مثل Dell، وFujistsu، وSupermicro، وCisco، وAtos، وHewlett Packard Enterprise، لتقديم منتجات مدعومة بـ H100.