ما هي وحدة NPU، هذه الشريحة الجديدة التي تأتي في الكمبيوتر المحمول الخاص بك؟

يتم تدريجيًا إدخال شريحة جديدة مخصصة للذكاء الاصطناعي في جهاز الكمبيوتر المحمول الخاص بك. ما الغرض منه؟ هل أنت حقا في حاجة إليها؟ تفسيراتنا.

فراندرويد

حرفان على شفاه الجميع منذ عام 2022: الذكاء الاصطناعي. يخرج الذكاء الاصطناعي من حدود الخيال العلمي ليصبح جزءًا لا يتجزأ من حياتنا في تطبيقات ملموسة. أصبحت هواتفنا الذكية وأجهزة الكمبيوتر والأجهزة اللوحية وحتى وحدات التحكم في الألعاب مجهزة الآن للتعامل مع المهام الحسابية المرتبطة بالذكاء الاصطناعي الأكثر أو الأقل تطلبًا.

وقد دعت البراغيث نفسها بشكل خاص إلى موقعناأجهزة الكمبيوتر المحمولة، وحدات NP (وحدة المعالجة العصبية)، وحدات حسابية أكثر كفاءة بكثير من وحداتكالمعالجلمعالجة طلبات الذكاء الاصطناعي. نخبرك بشكل ملموس عن الغرض من استخدامها ولماذا أصبحت الآن في قلب الحوسبة الاستهلاكية.

شريحة جديدة في أجهزة الكمبيوتر لدينا

قبل أن نصل إلى جوهر الموضوع، نحتاج إلى تحديد ماهية شركة نفط الجنوب، والتي ستكون وحدة NPU، هذه الشريحة الجديدة، جزءًا لا يتجزأ منها. SoC، لـ System-on-Chip، هو مصطلح مرتبط بالهواتف الذكية والأجهزة اللوحية وأجهزة الكمبيوتر المحمولة الأخرى.

بدلاً من وضع عدة شرائح منفصلة منفصلة على دائرة مطبوعة كما في الماضي، نقوم بدمج كل شيء على مستوى دائرة واحدة بفضل التصغير: المعالج (CPU)، شريحة الرسومات (GPU)، المودم، والصوت. في بعض الأحيان، يتم تخصيص SoC أيضًا لمهام أخرى مثل Apple's T2 للأمان داخل أجهزة كمبيوتر Mac.

SoC الخاص بـ Snapdagon X Elite من Qualcomm // المصدر: Qualcomm

ولكن من المتوقع أن تتطور هذه الشركات وفقًا للاستخدامات والتقنيات التي يرغب المصنعون في دمجها فيها. لقد وصل الذكاء الاصطناعي إلى هواتفنا الذكية، ولكن أيضًا إلى أجهزة الكمبيوتر المحمولة لدينا، وأصبح من الضروري تنفيذ بعض هذه المعالجة مباشرة على الجهاز. نحن نتحدث هنا عن تشغيل نماذج اللغة الطبيعية مثل GPT من خلال Copilot على Windows، وإجراء المعالجة أو حتى إنشاء الصور أو حتى الترجمات التلقائية وميزات إمكانية الوصول المتنوعة.

مع مرور الوقت، ستختفي أعباء عمل الذكاء الاصطناعي وتكنولوجيا المعلوماتالتعلم الآليكانوا قادرين على العمل جزئيا محليا،على الجهازوذلك بفضل دمج الشريحة المخصصة NPU لوحدة المعالجة العصبية. في Appel نسميها المحرك العصبي، وفي Google نطلق عليها وحدة معالجة Tensor لـ TPU، ولكن الهدف هو نفسه: تسريع أعباء العمل المتعلقة بالذكاء الاصطناعي.

المعالج الخاص بك وبطاقة الرسوماتقادرون على الأداءالتعلم الآليولكن لديهم قوتهم وضعفهم في هذا الصدد. وحدة NPU مخصصة لمحاكاة كمية هائلة من البيانات بالتوازي، لتقليد عمل الشبكات العصبية، التي تؤدي نفس العملية (مصفوفة أو ناقل) ملايين المرات، ولكن بمعلمات مختلفة.

يمكن لوحدة المعالجة المركزية التركيز على مهمة استدلال واحدة، ولكن بزمن انتقال منخفض للغاية، في حين أن وحدة معالجة الرسومات، بفضل رقائق تسريع الذكاء الاصطناعي (لا سيما Tensor Cores لبطاقات الرسومات Nvidia RTX)، يمكنها أيضًا معالجة كمية هائلة من البيانات بالتوازي، ولكن استهلاك طاقة أعلى بكثير. لا تزال NPU متخلفة كثيرًا عن وحدات معالجة الرسومات في مهام الاستدلال الكبيرة، مثل تشغيل LLM حقيقي محليًا أو تنفيذ إنشاء صور متقدم، وذلك بسبب الاختلاف الكبير في TOPS ودقة الحساب.

إنتل

يتم حساب الطاقة الأولية لوحدة NPU بـ TOPS، لتريليونات العمليات في الثانية، على غرار TFLOPS لوحدات معالجة الرسومات. وبالتالي، فإن وحدات NPU الخاصة بـ SoCs الحالية تتأرجح بين 40 و50 TOPS، وتتجاوز بعض بطاقات الرسومات الاستهلاكية 1000 TOPS بكثير، ولكن لاستهلاك أعلى بكثير.

ومن الضروري أيضًا أن تكون على دراية بالدقة الحسابية لهذه الرقائق. يتم الإبلاغ عن هذه القيمة كأعداد صحيحة وبتات، وتمثل مقايضة بين السرعة والدقة. وبالتالي، فإن INT4، وهو أقل دقة، يمكن أن يكون مفيدًا أثناء المهام التي تكون فيها سرعة التنفيذ ذات أهمية قصوى.

يتم تفضيل قيمة INT8 بشكل عام من قبل الشركات المصنعة لحساب الطاقة الأولية لوحدة NPU، مما يوفر دقة حسابية فائقة لسرعة حسابية عالية بما يكفي لاستخداماتنا، مثل التعرف على الصور بالإضافة إلى معالجة الصور/الفيديو الأساسية.

مصدر الصورة: أوتاكسو

بشكل عام، يفكر المصنعون في INT8، لأنه دقة كافية للاستخدام العام، لكن المحترفين والعلماء يفضلون الدقة في 16 وحتى 32 بت اعتمادًا على احتياجاتهم. هذه القيم أكثر دقة، ولكنها أكثر تطلبًا في الطاقة الخام.

ما فائدة في أجهزتنا؟

بالنسبة للمستخدمين، يتعلق الأمر بزمن الوصول والأمان. تتم معالجة بعض مهام الذكاء الاصطناعي التي يتم ترحيلها إلى وحدة NPU بسرعة أكبر محليًا مقارنة بالسحابة، وكل هذا يعتمد على قوة الشريحة. وبالتالي، ستعمل هذه المهمة أو تلك بشكل أفضل محليًا على NPU أو على السحابة اعتمادًا على عبء العمل المختار.

ستعمل وحدة NPU على تفريغ عمل وحدة المعالجة المركزية ووحدة معالجة الرسومات للقيام بمهام أخف، مثل الترجمة المباشرة أو الترجمة التلقائية لنظام Windows أو تأثيرات الكاميرا التي نراها الآن في Microsoft Teams أو Google Meets. تضمن Microsoft أن وحدة NPU أكثر كفاءة بمقدار 100 مرة على نظام التشغيل Windows في كل هذه المهام من وحدة المعالجة المركزية، مما يؤدي إلى تحقيق مكاسب في الاستقلالية.

مساعد Microsoft 365 // المصدر: Microsoft

على نظام التشغيل Windows، يمكن أيضًا استخدام وحدة NPU لتحسين أداء ألعابك بفضل وظيفة ترقية AutoSR المدعومة بالذكاء الاصطناعي. على أجهزة Mac، سيتم استخدام المحرك العصبي لتشغيل Apple Intelligence، وهو مساعد الذكاء الاصطناعي من Apple المدمج في جميع جوانب النظام.

نحن فقط في المراحل الأولى من الذكاء الاصطناعي المحلي، لذلك لا يزال الاتصال بالإنترنت ضروريًا لتشغيل بعض هذه الميزات. لكن وحدات المعالجة العصبية ستكتسب السرعة والدقة، مما يفتح الباب أمام تطبيقات واستخدامات أخرى لتحسين الإنتاجية والإبداع على أجهزة الكمبيوتر المحمولة. على أية حال، هذا هو وعدهم.


هل ترغب في الانضمام إلى مجتمع من المتحمسين؟خلافنايرحب بكم، إنه مكان للمساعدة المتبادلة والشغف بالتكنولوجيا.