كشفت وسائل الإعلام الإنجليزية "CNBC" عن بعض التفاصيل حول PaLM 2، نموذج اللغة الجديد من Google والذي يميل إلى الاندماج في جميع خدماتها. نموذج لغة سيكون أكثر تدريبًا من نسخته الأولى.
قبل أيام قليلة، بمناسبةمؤتمر جوجل آي/أو 2023,لقد رفعت Google الحجاب عن PaLM 2، نموذج اللغة الداخلي الخاص بها والذي يهدف إلى دمج خدماتجوجللأغراض إنشاء النص التلقائي. سيكون هذا الذكاء الاصطناعي أكثر تدريبًا بخمس مرات من PaLM (أو نموذج لغة المسارات) الذي يأتي أولاً من الاسم، وفقًا لـسي ان بي سي.
الذكاء الاصطناعي أكثر تدريباً بخمس مرات
تمكنت وسائل الإعلام الأمريكية من الوصول إلى مستندات Google الداخلية ووفقًا لها، كان من الممكن تدريب PaLM 2 على 3.6 تريليون رمز. الرمز المميز عبارة عن سلسلة من الكلمات التي تسمح لنموذج اللغة بالتنبؤ بالكلمة التالية التي ستظهر في تسلسل النص.
وهذا ما يقرب من خمسة أضعاف نموذج PaLM الأول الذي تم إصداره في عام 2022 والذي تم تدريبه على 780 مليار رمز مميز. ومن الناحية العملية، يوفر هذا استخدامات أكثر تقدمًا، لا سيما في برمجة الكمبيوتر والرياضيات والكتابة الإبداعية.يمكن استخدام هذا النموذج للأغراض الطبيةرغم أنه لن يحل محل الأطباء (حتى الآن).
ومع ذلك، فإن PaLM 2 سيكون "الأصغر» من نسخته السابقة، مع استمرار نجاحه في إنجاز مهام أكثر تعقيدًا. سيتم تدريبه على 340 مليار معلمة، مقارنة بـ 540 مليارًا لـ PaLM 1. إذا اعترفت Google علنًا بأن LLM (لـ PaLM 1)نموذج لغة كبير، أو نموذج لغة كبير) كان "أكثر كفاءة مع أداء عام أفضل، بما في ذلك الاستدلال الأسرع، ومعلمات أقل للعرض، وتكلفة أقل للعرض"، ولم يتم تقديم أي أرقام. ولكن لا يزال ذلك كافيًا لتحقيق الكفاءة، ولكن أيضًا وقبل كل شيء في القوة الحاسوبية، وهي إحدى أعصاب الحرب في سباق الذكاء الاصطناعي.
لماذا لا نعرف الكثير عن تصميم PaLM 2؟
صحيح أن Google بخيلة في التفاصيل المتعلقة بتصميم PaLM 2.سي ان بي سييشرح ذلك بـ "طبيعة تنافسية» من هذا النشاط، مع التذكير بأن OpenAI قد تفتقر إلى الشفافية: فنحن لا نعرف الكثير عنهاجي بي تي-4لا.
ملاحظة أدلى بها أيضًا العديد من العلماء الذين يناضلون من أجل قدر أكبر من الوضوح في عمل هذه الذكاءات الاصطناعية التوليدية.سي ان بي سيويحدد أن المهدي المحمدي، الباحث ذو الخبرة في أبحاث جوجل، استقال من منصبه في فبراير الماضي”.بسبب افتقار الشركة للشفافية.»
تريد بعض مشاريع الذكاء الاصطناعي أيضًا أن تكون شفافة، وهذا هو الحال بشكل أساسي بالنسبة لما يسمى بالأدوات.مفتوح المصدر، مثلدولليأو حتىStableLM، وكلاهما صدر مؤخرًا.
من الصعب أن نحدد بشكل موضوعي ما هو أفضل نموذج لغوي. لكن للمقارنة،لهب الهدفتم تدريبه على 1.4 تريليون رمز وGPT-3 بـ 300 مليار رمز: لا نعرف هذا الرقم لـ GPT-4. لا تستخدم Google نموذج لغة واحدة: فقد صممته الشركة أيضًالامدا، والتي كان سيتم تدريبها على 1.5 تريليون رمز.
من جهتنا، فيفراندرويد,لقد اختبرنا Google Bard وChatGPT وBing Chat لمقارنة أدائها. يجب أن ندرك أن برنامج الدردشة الآلي الخاص بشركة Google هو الذي يقدم أفضل أداء في التمارين، على الرغم من ذلكحقيقة أنه غير متوفر باللغة الفرنسيةولا يمكن الوصول إليها من فرنسا. ولحسن الحظ، هناك طريقة لذلكاستخدم Google Bard، حتى لو كان محظورًا في فرنسا.