لماذا يوضح OpenAI أن ChatGPT o1 قادر على "الاستدلال"

لا مزيد من الذكاء الاصطناعي الذي يهلوس ويخترع أي شيء؟ هذا ما تدعي شركة OpenAI أنها تقدمه مع o1، وهو نموذج ذكاء اصطناعي يتميز بأسلوب التعلم الخاص به. سيكون هذا الذكاء الاصطناعي قادرًا على "الاستدلال". كيف يعمل؟

الصورة التي تم إنشاؤها باستخدام ChatGPT

يستمر الذكاء الاصطناعي في دفع حدود ما هو ممكن. ومن بين آخر التطورات،أوبن إيه آي o1جديد تمامًا.

للذهاب أبعد من ذلك
انسَ ChatGPT GPT-4، إليك OpenAI o1: الذكاء الاصطناعي الذي يمكنه "التفكير"

تنص OpenAI على أن هذا الذكاء الاصطناعي يمكنه التفكير، وذلك بفضل استخدامه للتعلم المعزز. ولكن ما الذي يجعل هذه الطريقة ثورية للغاية وكيف يمكن مقارنتها بالنماذج الأخرى مثل GPT-4o أو Google Gemini أو Claude AI؟

تعزيز التعلم: نهج جديد

على عكس GPT-4o والنماذج السابقة، لا يحاكي Open AI o1 مخططاته التدريبية، بل يستخدم التعلم المعزز لحل المشكلات المقدمة إليه بمفرده.

ولكن ما هو التعلم المعزز؟ إنها في الأساس طريقة يتعلم فيها الذكاء الاصطناعي من خلال التجربة والخطأ. إنها تتلقى مكافآت على الأفعال الجيدة وعقوبات على الأفعال السيئة، مما يسمح لها بالتحسن بمرور الوقت.

علق OpenAI قائلاً إن تدريب Open AI o1 تم إجراؤه باستخدام مجموعة بيانات مصممة خصيصًا وخوارزمية تحسين جديدة. وهذا يعني أنه تم تدريب الذكاء الاصطناعي على بيانات محددة وبأساليب متقدمة لتعظيم أدائه. على عكس النماذج التقليدية التي تعتمد على الأنماط التي تم تعلمها أثناء التدريب لتوليد الاستجابات، يستخدم Open AI o1 التعلم المعزز لحل المشكلات بشكل مستقل.

وقف الهلوسة؟

إحدى الفوائد الرئيسية لـ Open AI o1 هي قدرته على تقليل "الهلوسة" الخاصة بالذكاء الاصطناعي. هذا لا يعني أن الذكاء الاصطناعي لن يرتكب الأخطاء أو يخترع إجابة. لكن OpenAI تقول إنها أقل شيوعًا مما كانت عليه في الإصدارات السابقة من GPT. للتذكير، الهلوسة هي استجابات غير صحيحة أو مختلقة يولدها الذكاء الاصطناعي أحيانًا، وغالبًا ما يكون ذلك بسبب عدم كفاية بيانات التدريب أو المتحيزة.

يتم تدريب النماذج التقليدية، مثل GPT-4o، على كميات هائلة من البيانات النصية لتعلم هياكل اللغة وأنماطها. يستخدمون بشكل عام بنية شبكة عصبية تسمى "محول"، والذي يسمح لك بمعالجة تسلسلات طويلة من النص بكفاءة.

نماذج اللغة هذه (ماجستير في القانون، نوضح ما هي هنا)إنهم مثل الطلاب الذين التهموا عددًا كبيرًا من الكتب والذين يحاولون الإجابة على الأسئلة بناءً على ما تعلموه.

قيد الاستخدام، تتنبأ هذه النماذج بـرمز مميز(كلمة أو جزء من كلمة) التالي على الأرجح بناءً على السياق المقدم. وبعد التدريب المسبق، يمكن ضبطهم على مهام محددة لتحسين أدائهم في مجالات معينة.

يستخدم Open AI o1 بعد ذلك "سلسلة فكرية" لمعالجة الاستعلامات، بنفس الطريقة التي يعالج بها البشر المشكلات من خلال معالجتها خطوة بخطوة.

الشيء الرئيسي الذي يميز هذا النموذج الجديد عن GPT-4o هو قدرته على حل المشكلات المعقدة، مثل التطوير والرياضيات، بشكل أفضل بكثير من سابقاته مع شرح أسبابه، وفقًا لـ OpenAI.

دخلت OpenAI برنامج LLM الجديد في مسابقة تسمىقوات التشفير. يشارك المبرمجون من جميع أنحاء العالم في حل المشكلات المعقدة. وتخمين ماذا؟ كان أداؤه أفضل من 89% من المشاركين من البشر. بالنسبة لـ OpenAI، هذه مجرد البداية: فقد أوضحوا أن الإصدار التالي سيكون قادرًا على حل المشكلات المعقدة في الفيزياء والكيمياء وعلم الأحياء، وفقًا لطلاب الدكتوراه الجدد.

وفي الوقت نفسه، لا يعمل o1 مثل GPT-4o في العديد من المجالات. لا يكون الأمر جيدًا عندما يتعلق الأمر بالمعرفة الواقعية حول العالم. كما أنه ليس لديه القدرة على تصفح الويب أو معالجة الملفات والصور.

من الواضح أننا لا نعرف دائمًا التفاصيل الدقيقة لكيفية عمل كل نموذج وقد تختلف. لماذا ؟ لأن الشركات التي تقوم بتطويرها لا تكشف دائمًا عن جميع المعلومات المتعلقة بأساليب التدريب الخاصة بها أو بنيتها الدقيقة. وهذا يمكن أن يجعل المقارنة المباشرة بين النماذج صعبة. ومع ذلك، يبدو أن التعلم المعزز يمثل تقدمًا ملحوظًا.

لنأخذ مثالا: عملية حسابية

ليس من السهل إظهار قدرات ماجستير إدارة الأعمال (LLM) بهذا الشكل، لكن دعنا نجرب هذا الاستعلام:

هل يمكنك حساب سعر البنزين الذي تصبح فيه السيارة الكهربائية المتوسطة (الاستهلاك المختلط 17 كيلووات في الساعة) أقل ربحية من السيارة الحرارية الهجينة الخفيفة، مع العلم أن تكلفة الكهرباء تبلغ 0.25 يورو لكل كيلووات في الساعة؟ ومن أجل هذا الحساب، يمكنك الافتراض أن السيارة الحرارية الهجينة المعتدلة تستهلك في المتوسط 5 لترات من البنزين لكل 100 كيلومتر. يرجى تقديم شرح مفصل لحسابك

باستخدام o1-preview، يمكننا رؤية المراحل المختلفة لتحليل استعلامي البسيط للغاية، وقد استغرق الأمر 8 ثوانٍ وفقًا لـ OpenAI:

كما ترون، الجمل تخلق وهمًا بالتفكير خطوة بخطوة.

لا تؤمن OpenAI بمساواة تفكير نماذج الذكاء الاصطناعي بالتفكير البشري. لكن من المفترض أن تُظهر الواجهة كيف يقضي النموذج وقتًا أطول في المعالجة والتعمق في حل المشكلات.

إذا كنت مهتمًا بالإجابة النهائية، فإليك ما يلي:

من الواضح أنني حصلت على نفس الاستجابة مع GPT-4o. يحب المتحدثون باللغة الإنجليزية اختبار إحدى المطالبات المعروفة جدًا: "كم عدد حرف R الموجود في الفراولة؟". تميل "النماذج القديمة" إلى الادعاء خطأً بأن كلمة ""الفراولة» يحتوي على حرفي R فقط لأنه لا يقسم الكلمة بشكل صحيح.

إذًا، هل Open AI o1 هي الثورة التي وعدنا بها حقًا؟ بصراحة، ما زال الوقت مبكرًا لمعرفة ذلك. لقد شهدنا الكثير من "الثورات" في مجال الذكاء الاصطناعي في السنوات الأخيرة، حتى أننا تعلمنا أن نكون حذرين.

ما هو مؤكد هو أن التعلم المعزز هو وسيلة واعدة. إذا حافظ GPT-o1 على وعوده، فمن الممكن أن يكون لدينا أنظمة ذكاء اصطناعي أكثر موثوقية، وأكثر إبداعًا، وأقل عرضة للجنون.

يمكن لمستخدمي ChatGPT Plus وTeam الوصول إلى o1-preview وo1-mini بدءًا من اليوم، بينما سيتمكن مستخدمو Enterprise وEdu من الوصول مطلع الأسبوع المقبل.

أعلنت OpenAI أنها تخطط لتوفير الوصول إلى o1-mini لجميع مستخدمي ChatGPT المجانيين، لكنها لم تحدد تاريخ الإصدار بعد.

يعد وصول المطورين إلى o1 مكلفًا للغاية: في واجهة برمجة التطبيقات، تبلغ تكلفة معاينة o1 15 دولارًا لكل مليون رمز إدخال، أو أجزاء من النص التي تم تحليلها بواسطة النموذج، و60 دولارًا لكل مليون رمز مميز للمخرجات. للمقارنة، تبلغ تكلفة GPT-4o 5 دولارات لكل مليون رمز إدخال و15 دولارًا لكل مليون رمز إخراج.