يميل الذكاء الاصطناعي التوليدي إلى أن يصبح أكثر شعبية. لكن في الوقت الحالي، جميعها مملوكة لشركات خاصة وتعمل على خوادم بعيدة. ماذا لو تمكنا من "تشغيل" ChatGPT على أجهزة الكمبيوتر لدينا؟ حقق المطور Simon Willison ذلك من خلال تشغيل LLaMA، نموذج لغة Meta، على جهاز الكمبيوتر المحمول الخاص به.
الاتجاه نحو لا يمكن إنكارهالذكاء الاصطناعيتوليد النص التلقائي:ChatGPT,بنج الجديد,سناب شات بلدي الذكاء الاصطناعي,محرك البحث أنتوقريباجوجل بارد. في الوقت الحالي، تعمل جميعها باستخدام خوادم في السحابة. ولكن في غضون سنوات قليلة، ومن خلال التحسين وزيادة قدرات أجهزتنا، يمكننا أن نجعلها وقودًا بفضل أجهزة الكمبيوتر لدينا. هذا هو الحال بالفعل، ليس مع النموذج اللغوي الأكثر شهرة، GPT-3، ولكن مع نموذج اللغةميتالاما. وبسبب تسرب الكود الخاص به، تمكن المطورون من استخدام LLaMa على أجهزة الكمبيوتر الخاصة بهم.
تسريب LLaMA، نموذج لغة ميتا
هذا ما غير كل شيء وفقًا لمطور المصادر المفتوحة سيمون ويليسون: وضع كود مصدر LLaMA على الإنترنت،نموذج اللغة الذي نشرته ميتاقبل بضعة أسابيع. الطموح كبير: يتم أخذ 65 مليار معلمة في الاعتبار عند إنشاء النص. علاوة على ذلك، تدعي Meta أن نموذجها يتفوق على GPT-3 في معظم النقاط.
ما أرادت شركة Meta أن تتميز به عن منافسيها هو انفتاح نموذجها. لقد تم إتاحتها للباحثين، على الرغم من أنه يجب قبول بعض الشروط الصارمة، مثل استخدامها فقط لأغراض البحث، دون الأغراض التجارية بالطبع. ولكن كما كتب سيمون ويليسون، بعد أيام قليلة من نشره، رأى LLaMA كود المصدر الخاص به منشورًا على الإنترنت مع جميع ملفات النموذج. لقد فات الأوان الآن بالنسبة لميتا: فطفلها موجود في البرية ويمكننا استخدامه محليًا.
ولذلك أدار سايمون ويليسون البرنامج بنفسهماك بوكولم يقمع عاطفة معينة: "عندما بدأ جهاز الكمبيوتر المحمول الخاص بي في إرسال رسالة نصية إليّ، شعرت حقًا أن العالم على وشك التغيير مرة أخرى.» من اعتقد أن الأمر سيستغرق سنوات قبل أن نتمكن من عمل نموذج مشابه لـ GPT-4، فقد كان مخطئًا: "هذا المستقبل موجود بالفعل هنا.»
وفقا للمطور "ويجب أن تكون أولويتنا هي إيجاد الطرق الأكثر بناءة لاستخدامها»، يتحدث عن الذكاء الاصطناعي. ويضيف أن "بافتراض أن فيسبوك لا يخفف شروط الترخيص، فمن المرجح أن يكون LLaMA دليلاً على مفهوم إمكانية استخدام نماذج اللغة المحلية على أجهزة المستهلك أكثر من كونه نموذجًا أساسيًا جديدًا سيستخدمه الناس في المستقبل."على أية حال"السباق مستمر لإصدار أول نموذج لغة مفتوح بالكامل يمنح المستخدمين إمكانات تشبه ChatGPT على أجهزتهم الخاصة.»
في مدونته، يشرح المطور كيف حقق هذا DIY. يتحدث سيمون ويليسون عن مشروع llama.cpp الذي أنشأه جورجي جيرجانوف، وهو أيضًا مطور مفتوح المصدر ومقره في صوفيا، بلغاريا. هذا الأخير لديهنشرت على جيثبلاما حتى "قم بتشغيل النموذج باستخدام التكميم 4 بت على جهاز MacBook.» يحدد سايمون ويلسون أن "التكميم 4 بت هو أسلوب لتقليل حجم النماذج بحيث يمكن تشغيلها على أجهزة أقل قوة. كما أنه يجعل من الممكن تقليل حجم النماذج الموجودة على القرص: 4 جيجابايت للطراز 7B وأقل بقليل من 8 جيجابايت للطراز 13B." ال "ب» هنا عدد المعلمات التي يستخدمها LLaMA، معبرًا عنها بالمليارات.
مخاطر المصادر المفتوحة أو نماذج اللغة المحلية العاملة
ومع ذلك، في حين أن هذا يعد أمرًا رائعًا لعالم المصادر المفتوحة ولقصر التحكم في نماذج اللغة هذه على هذه الشركات القليلة، إلا أن هذا "يطلق» لديه بعض المخاطر. حتى أن سايمون ويليسون قام بإعداد قائمة بالطرق التي يمكن من خلالها استخدام هذه التكنولوجيا للأذى:
- توليد البريد العشوائي
- حيل الحب الآلية
- التصيد وخطاب الكراهية
- الأخبار الكاذبة والمعلومات المضللة
- التطرف بسبب تأثير الفقاعة
علاوة على ذلك، فإن هذه "المتعددة"ChatGPT» يمكنها دائمًا اختلاق أشياء خاطئة بنفس المستوى الذي يمكنها من خلاله كتابة جمل صحيحة. وهنا أيضاً تكمن قوة "جاما»: من خلال توفير الوصول إلى نماذج اللغة الخاصة بهم عبر الأجهزة الافتراضية أو واجهة برمجة التطبيقات (API) أو أدوات المحادثة، يمكنهم إضافة طبقات من الإشراف. ومن خلال التعديلات الدقيقة التي يجب تحسينها باستمرار، يمكنهم التحكم في الطريقة التي يتفاعل بها المستخدمون مع هذه الذكاءات الاصطناعية. ومن خلال تشغيل هذه العناصر محليًا، قد نفقد طبقات التحكم هذه.
الشركات الرقمية الكبرى فقط هي التي تتحكم في نماذج اللغة
أخيرًا، نماذج اللغة قليلة العدد: ومن بين أهمها، ندرج GPT-4 من OpenAI،جوجل لامداأو حتى LLaMA بواسطة Meta. إذا لم تتحكم Microsoft بشكل كامل في OpenAI،استثمر حوالي 10 مليارات دولار في الشركة. تم الإعلان عنها مؤخرًا،GPT-4 هو إصدار رئيسي جديد من GPTوالذي يأخذ في الاعتبار العديد من المعلمات، للحصول على أداء أفضل ودقة أكبر. فإذا قلنا أن التعبير "جاما» قد يبدو الأمر مختزلًا، لكن في الواقع هذه الشركات الخاصة القليلة هي التي تتحكم في نماذج اللغات الأكثر شيوعًا. والمخاطر المحتملة لهذه السيطرة كبيرة: فهي في الحقيقة صناديق سوداء لا نعرف عنها الكثير.
وتوجد مبادرات أخرى، حتى في فرنسا. بالنسبة لنا، فإن Hugging Face ونموذج Bloom الخاص بها هو في المقدمة. كما هو مبينلو فيجاروتأسست الشركة على يد ثلاثة فرنسيين وتبلغ قيمتها 2 مليار دولار. نموذج لغوي مصمم بمصدر مفتوح وبالتعاون مع المركز الوطني للبحث العلمي: كان “تم التدريب لمدة مائة وسبعة عشر يومًا على الكمبيوتر العملاق العمومي الفرنسي جان زاي، وتم تنزيله مجانًا من قبل أكثر من 65000 متخصص". الطموح واضح: يحلم Hugging Face بزهرة فرنسية أوروبية ستنافس ChatGPT. إذا كان هذا النوع من الذكاء الاصطناعي لا يزال مخصصًا للشركات الكبيرة، فذلك أيضًا لأن تطويره يتطلب تمويلًا كبيرًا.
يعد تشغيل الذكاء الاصطناعي التوليدي أمرًا مكلفًا
هذا الاسبوع،قدمت Microsoft أجهزة افتراضية جديدة في Azure، الحل السحابي الخاص بها: تم تصميمها خصيصًا للذكاء الاصطناعي. ولكن لكي ينجح كل هذا،مايكروسوفتناشدتوحدة معالجة الرسومات نفيديا H100. بنية تحتية تكلف مئات الملايين من الدولاراتنفيديافي النهاية الفائز الأكبر في هذا السباق الذي ينطلق فيه جميع العمالقة. بجانب،وقد يؤدي هذا السباق إلى نقص آخر في بطاقات الرسوميات خلال الأشهر المقبلة، بحسب بعض التوقعات.
كما كتب سيمون ويليسونمقال الابن، تعد نماذج إنشاء النص التلقائي أكبر من نماذج إنشاء الصور، مثل Stable Diffusion أو Midjourney أو حتىمن-E 2. بالنسبة له "حتى لو تمكنت من الحصول على طراز GPT-3، فلن تتمكن من تشغيله على أجهزة سلعية - تتطلب هذه النماذج عادةً وحدات معالجة رسومات متعددة من فئة A100، والتي يُباع كل منها بأكثر من 8000 دولار.»
بالإضافة إلى القوة الحاسوبية الكبيرة، هناك حاجة أيضًا إلى فرق مؤهلة لإنشاء هذه النماذج. بالنسبة لسيمون ويليسون مرة أخرى، على الرغم من وجود العشرات من النماذج، إلا أنه لم يتمكن أي منها من تحديد المربعات التالية:
- سهولة التنفيذ على الأجهزة الخاصة
- قوية بما يكفي لتكون مفيدة (أداء يعادل GPT-3 أو أفضل)
- مفتوحة بما فيه الكفاية لتكون قادرة على التحرير.