يغذي الذكاء الاصطناعي العديد من الأوهام، لكن تشغيله على الهواتف الذكية بسيط للغاية في الحقيقة. دعنا نشرح كيفية إجراء مثل هذه العمليات على جهازك لفهم الاتجاه الجديد بشكل أفضل.
الذكاء الاصطناعي. اليوم أصبح موضوعًا شائعًا في عالم التكنولوجيا، وكان في السابق قبل كل شيءموضوع من الخيال للخيال العلمي. بالضرورة، انتهى الأمر باختلاط الاثنين، على الرغم من عدم وجود الكثير من القواسم المشتركة بينهما.
هذا التمثيل الخيالي يعني أن قلة من الناس يستطيعون فهمهما هو الذكاء الاصطناعي الموجود على الهواتف الذكية حقًا؟في الوقت الحاضر. ولهذا السبب، حان الوقت اليوم لإزالة الغموض عن الأمور. ولهذا، ما الذي يمكن أن يكون أفضل من إعطائك مثالاً عما يحدث في هاتفك الذكي عند التقاط صورة شخصية؟
سنرشدك خطوة بخطوة، دون استخدام الكثير من اللغة المعقدة، حتى تتمكن من فهم ماهية الذكاء الاصطناعي للهاتف الذكي وكيفية عمله بشكل ملموس. هل أنت مستعد للغوص في أعماق هاتفك الذكي؟
تدريب النموذج الخاص بك
بادئ ذي بدء، يجب أن نفهم أن ما نسميه "الذكاء الاصطناعي» هذه الأيام تدعو في الواقع إلى "التعلم الآلي". هواتفنا الذكية ليست في الواقع "ذكي»: إنها الطريقة التي يتم بها تنظيم الخبرات التي يقدمونها.
في أي برنامج كمبيوتر، نستخدم مفهومًا رياضيًا يسمى "الخوارزميات". يتيح ذلك للمطورين اقتراح عدة سيناريوهات بنتائج مختلفة. ومع ذلك، في الإطار الكلاسيكي، من الضروري أن يكون سلوك المستخدم أو الكائن معروفًا مسبقًا حتى تتمكن من التحكم في التجربة.
ال "التعلم الآلي» (التعلم الآلي)، الذي هو أساس الذكاء الاصطناعي المعاصر، مختلف. هنا، ليس من الضروري أن نعرف مسبقًا ما سيفعله المستخدم أو المنتج: فالآلة قادرة بنفسها على فهم ما هو، وإنشاء بنية شجرة كاملة تسمح لها بالخروج من النتيجة.
لبرمجة هذا، يقوم المطورون بإنشاء "نماذج"، وهي خوارزميات خاصة قادرة على إيجاد أنماط متشابهة بين جميع البيانات المرسلة إليها. هذا هو الغرض الوحيد للبرنامج: العثور على المعلومات التي تحاول العثور عليها. في مثالنا، سنسعى إلى فصل الشخص عن بقية الصورة. بمجرد إنشاء النموذج، نرسل إليه أطنانًا وأطنانًا من البيانات (كلما زاد عددها، كان ذلك أفضل) ونسمح له بالتعلم من تلقاء نفسه.
هنا، سيتم تحليل عدة أجزاء من المعلومات (الأنف والفم والحاجبين والجلد وما إلى ذلك) لعزل موضوع صورتنا بنجاح وفهم مكان معالمه. لكنه تدريب: تأخذ النموذج، وترسل إليه الكثير من البيانات، وتخبره بأخطائه، ثم تبدأ من جديد. وهذا حتى يصبح أكثر دقة وينتج أقل عدد ممكن من الأخطاء.
لذلك لا يتعلق الأمر حقًا بـ "الذكاء» بالمعنى الدقيق للكلمة، ولا حتى السلوك المستقل: ما يتغير حقًا هو طريقة النظر إلى البرمجة. ال "التعلم الآلي» هي طريقة جديدة لإنشاء برنامج يسمح باستخدامات جديدة، لكننا بعيدون عن انتفاضة الآلات. نحن قادرون فقط على إنشاء خوارزميات تصنيف ذات هدف واحد محدد، والتأكد من تحسينها بمرور الوقت وكمية البيانات التي تتلقاها.
نموذج مفهوم من قبل الجميع
هذا هو "نموذج مدرب» والتي ستصل بعد ذلك إلى هواتفنا الذكية وتمكين وظائف معينة. ومع ذلك، تمامًا مثل البرمجة الكلاسيكية (أو اللغات بشكل عام)، ليست كل اللغات مفهومة من قبل جميع المنصات.
لقد سمعت بالتأكيدTensorFlow من جوجل، أو حتىقهوة فيسبوك. هؤلاء هم ما نسميه "نطاق". بدلاً من برمجة كل شيء من الصفر، يمكن للمطورين استخدام هذه الأشياء كأساس للتطوير والبناء عليها. وبالتالي، يمكنهم الوصول إلى العديد من الأدوات التي تم إعدادها بالفعل من قبل منشئيهم ويمكنهم بدء عملهم بسهولة أكبر. ومن خلال هذه "الأطر» أن غالبية «نماذج» يتم إنشاؤها.
وبما أن هذه الأدوات معروفة وعالمية، يحتاج الجهاز فقط إلى دعمها ليتمكن من فهم النموذج الذي تريد التطبيقات استخدامه. ومع ذلك، يستمر عددها في التزايد، وبالتالي ليس هناك ضمان بأن كل شيء يعمل على أي جهاز. للتعويض عن ذلك، المبادراتمثل اونكس(افتح تبادل الشبكة العصبية) موجودة ويتم دفعها بواسطة أسماء كبيرة في مجال التكنولوجيا مثلمايكروسوفتوآخرونفيسبوك.
هذه منصة تسمح لك بتحويل لغة غير مألوفة تلقائيًا إلى شيء مفهوم، أو نوع من المترجم الآلي إذا أردت ذلك. وبالتالي، فهو يتيح إمكانية التشغيل البيني بين مختلفالأطريستخدمها المطورون ويدفع صناعة الذكاء الاصطناعي الناشئة إلى أبعد من ذلك.
في مثالنا، نموذجنا الخاص بفصل موضوع الصورة عن خلفيتها لا داعي للقلق بالضرورة بشأن النظام الأساسي الذي سيتم إطلاق الصورة عليه. سيكون المترجمون مسؤولين عن فهمه، بغض النظر عن مكان وصوله.
تعتني الشريحة بحساب كل شيء
تم تدريب نموذجنا ويمكن فهمه بواسطة أي جهاز. ولذلك فقد حان الوقت لاستخدامه بشكل ملموس في تطبيق الهاتف الذكي. تأخذ هاتفك الذكي، وتفتح تطبيق الصور، وتتحول إلى الوضع الرأسي. تشير به إلى صديق يقف أمامك مباشرة.
ها نحن. تنبض الحياة بالشريحة الموجودة في هاتفك الذكي ويحدث كل شيء بالتوازي. عندما نتحدث عن شركة نفط الجنوب (أوالنظام على شريحة)، نتحدث كثيرًا عن وحدة المعالجة المركزية ووحدة معالجة الرسومات. وحدة المعالجة المركزية هي الجزء المسؤول عن معالجة الحسابات الأكثر شيوعًا، بينما وحدة معالجة الرسومات مسؤولة بشكل عام عن العمليات الحسابية المتعلقة بالعناصر الرسومية. ومع ذلك، يجب أن نفهم أن شركة نفط الجنوب غالبًا ما تدمج عددًا من الرقائق أكثر من هاتين الرقاقتين، ولهذا السبب سنتحدث عن شركة نفط الجنوب كمنصة.
بالفعل، غالبًا ما تحتوي وحدة المعالجة المركزية (التي يُنظر إليها على أنها عامة) على عدة مراكز، لكل منها خصائصها الخاصة. بشكل عام، لدينا نوى تتولى المهام الصغيرة ولا تستهلك الكثير، ونوية أكثر قوة تستهلك المزيد لإجراء حسابات أكبر. لكن بعض الحسابات محددة للغاية، وبالتالي يمكن تحسينها بشكل أكبر.
هذا هو السبب في أن معظم SoCs تتضمن شرائح مخصصة لمهام محددة. على سبيل المثال، بالنسبة للتصوير الفوتوغرافي، تدمج العديد من شركات الاتصالات ما يسمى "مزود خدمة الإنترنت» (معالج مستشعر الصور): هذه شريحة مخصصة فقط للحسابات اللازمة لتفسير ومعالجة البيانات الواردة من مستشعر الصور. البعض الآخر، مثل DSPs، مخصص فقط لمعالجة الإشارات الرقمية، وما إلى ذلك.
عندما تلتقط صورة، يتم كل شيء بالتوازي. لنحذف الذكاء الاصطناعي من المعادلة لبضعة أسطر: عندما تلتقط صورة، ستكون وحدة المعالجة المركزية مسؤولة عن تشغيل التطبيق نفسه، ومن المؤكد أنه سيتم استخدام وحدة معالجة الرسومات للرسوم المتحركة للتطبيق، وسيقوم مزود خدمة الإنترنت بتسجيل وتحويل الصور المستلمة الإشارات إلى ملف مفهوم، وها أنت مع صورتك. أضف الذكاء الاصطناعي إلى ذلك، وسيكون هناك جزء آخر مسؤول عن إجراء الحسابات للوصول إلى النتيجة المرجوة.
ومع ذلك، كل شركة نفط الجنوب لديها طريقتها الخاصة للقيام بالأشياء.
حالة كوالكوم أنف العجل
لشرح مبدأ تشغيل أحدث معالجات Qualcomm SoCs، تمكنا من التحدث مع Gary Brotman، كبير مديري المنتجات في شركة Qualcomm المتخصصة في الذكاء الاصطناعي.
وأوضح لنا أن نهج شركة كوالكوم في هذا النوع من العمليات كان "غير متجانسة". لا تهدف Snapdragon SoC إلى دمج كل استخدام لشريحة معينة، بل تهدف إلى النظر في كل نوع من العمليات المطلوبة منها وتوزيعها بشكل عادل نسبيًا عبر وحدة المعالجة المركزية ووحدة معالجة الرسومات والعديد من معالجات الإشارة الرقمية الخاصة بها بما في ذلك "Hexagon،" والتي تم تطبيقها على مدار ثلاثة أجيال على بعض التحسينات لحسابات الذكاء الاصطناعي.
منلو أنف العجل 855، لا تزال شريحة Hexagon 690 تدمج "مسرع التوتر»، محرك مخصص لمضاعفات المصفوفات والمنتجات التلافيفية الخاصة بالذكاء الاصطناعي. افهم أن هذا هو إلى حد ما "وحدة NPU" كما تسميها شركة Huawei، على الرغم من أن شركة Qualcomm لا تريد أن تمنحها مثل هذا الاسم: فهي تترك ذلك لشركائها في التصنيع. عندما تتلقى شركة Snapdragon SoC هذا النوع من الطلب، يمكن تحريك العديد من الأجزاء بالتوازي.
دعونا نعود إلى مثالنا. عند التقاط صورة في الوضع الرأسي، ستتم معالجة كل من الصورة والنموذج بواسطة شركة نفط الجنوب بأكملها. ستذهب بعض العمليات من نوع الصورة في المقام الأول إلى مزود خدمة الإنترنت، وستذهب حسابات معينة لنموذج الذكاء الاصطناعي إلى Hexagon Tensor Accelerator، ولكن من حيث القيمة المطلقة، لا توجد حدود: يمكن استخدام جميع أجزاء SoC، وحدة المعالجة المركزية و وحدة معالجة الرسومات متضمنة. ستكون المنصة نفسها مسؤولة عن تحديد أي من أجزائها سيكون قادرًا على تقديم أفضل نتيجة في تلك اللحظة.
ومع ذلك، لا تريد شركة كوالكوم أن تكون صاحبة السيادة المطلقة في هذه القرارات. إن SDK، أو مجموعة التطوير التي يستخدمها المبرمجون لتزويدهم بأدوات إضافية متنوعة، تسمح لأي شخص بتحسين سلوك SoC من أجل وضع حساباته بدقة شديدة على شريحة معينة. هذه هي التحسينات العميقة الممكنة لأولئك الذين يرغبون.
الآن هواوي كيرين
لقد حاولنا معرفة المزيد حول كيفية عمل شرائح Kirin SoC الخاصة بشركة Huawei والتي تم إنشاؤها بواسطة HiSilicon، ولكن لسوء الحظ لم تتمكن الشركة المصنعة من تزويدنا بالإجابة.
يبدو أن شركة Huawei لديها نهج أكثر تخصصًا. إلى وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسومات (GPU) ومزود خدمة الإنترنت (ISP).تتم إضافة NPU(أووحدة المعالجة العصبية)، شريحة مخصصة بالكامل لحسابات الذكاء الاصطناعي. على عكس كوالكوم، يبدو أن الشركة تريد قبل كل شيء فصل عمليات الذكاء الاصطناعي عن بقية الحسابات لتحسينها بشكل أكبر.
في المثال، عندما تلتقط صورة، ستتم معالجة جميع المعلومات الأولية للصورة (الألوان والحدة وISO وما إلى ذلك) بواسطة مزود خدمة الإنترنت، بينما ستكون وحدة NPU مسؤولة عن حساب النموذج المطلوب (العثور على الكائن البشري من الصورة وفصلها) وتقديم النتيجة.
في حالة Exynos SoCs من سامسونج، لم نحصل على معلومات دقيقة من العملاق الكوري، ولكن وجود وحدة NPU في أحدث طراز لها يجعلنا نعتقد أنها تعمل بشكل أو بآخر بنفس الطريقة التي تعمل بها Huawei.
البيانات موجودة، وهنا النتيجة
يسمح لنا النموذج بفصل الموضوع البشري عن خلفيته، وهو مفهوم لجميع أنواع الرقائق بفضل استخدامهالأطر، وتم تحسين SoCs لتتمكن من استخدام هذا النموذج بالتوازي مع المهام الأخرى. يحتوي الهاتف الذكي الآن على جميع البيانات التي يحتاجها.
كل ما تبقى هو الاستمتاع بالصورة الجميلة التي تم التقاطها، والتي تم تقسيمها الآن إلى قسمين: الهدف البشري والخلفية. سيحتفظ الهاتف الذكي بالجسم البشري على هذا النحو، مع القواطع التي يحددها النموذج، وسيطبق ببساطة تأثيرًا ضبابيًا على الخلفية. صورتك في الوضع الرأسي جاهزة!
وهذا بالطبع مثال مبسط للغاية لكي يساعدك على فهم الشكل الذي نسميه “الذكاء الاصطناعي» على الهاتف الذكي. ليست ذكية وبالتالي قد تكون مرعبة كما يبدو، أليس كذلك؟
يجب أن نفهم أن الذكاء الاصطناعي كما نفهمه اليوم هو مجرد طريقة جديدة للبرمجة تفتح إمكانيات جديدة. سواء كان الأمر يتعلق بالتصوير الفوتوغرافي أو مجالات التحسين الأخرى، مثل الاستقلالية أو أداء الهاتف الذكي نفسه، يمكن للمطورين الآن اللعب بالنماذج بدلاً من التحديد المسبق للاستخدام الذي سيتم القيام به.
ونحن فقط في بدايةالتعلم الآلي. من يدري ما يخبئه لنا مستقبل الهواتف الذكية بهذا المعنى؟ الحد الوحيد هو خيال المطورين في هذا السياق.
للذهاب أبعد من ذلك
هل يجب أن نخاف من الذكاء الاصطناعي؟