تواصل OpenAI إطلاق منتجات جديدة. وكان المشغل ينتظر بفارغ الصبر.
كشفت OpenAI للتو عن Operator، وهو أول وكيل ذكاء اصطناعي قادر على أداء مهام ملموسة على جهاز الكمبيوتر.
للذهاب أبعد من ذلك
"المشغل" أو كيف يستعد ChatGPT للسيطرة على جهاز الكمبيوتر الخاص بك قريبًا جدًا
وهذه خطوة في تطور الذكاء الاصطناعي. للتوضيح: حتى الآن، عرضت OpenAI ChatGPT، وهي محادثة محادثة سلبية إلى حد ما، لأنها لا تستطيع أداء مهام محددة.
مع المشغل، ننتقل من مساعدي المحادثة البسيطين إلى وكلاء مستقلين حقيقيين. استنادًا إلى نموذج GPT-4o، يمكن للمشغل تصفح الويب وملء النماذج والتفاعل مع واجهات مختلفة كما يفعل المستخدم البشري.
خصوصية المشغل هي قدرته على تقسيم المهام المعقدة إلى إجراءات بسيطة، وذلك بفضل نموذجهوكيل استخدام الكمبيوتر (CUA). على عكس الحلول التقليدية التي تتطلب واجهات برمجة تطبيقات محددة، يقوم المشغل بتحليل وحدات البكسل الموجودة على الشاشة مباشرة لفهم أي واجهة مستخدم رسومية والتفاعل معها. لذلك نرى الماوس يتحرك وينفذ الإجراءات على متصفح الويب الخاص به.
بعض الأمثلة؟ يمكنك دمج ملفات PDF، وضغط الصور، والتقاط لقطات الشاشة، وإرسال بريد إلكتروني... ويمكنك دمج كل شيء لأداء مهام معقدة.
هذا ليس وكيل الذكاء الاصطناعي الأول. لكن المشغل يتفوق بالفعل على منافسيهمثل استخدام الكمبيوتر بواسطة Anthropicأوانقع جوجل DeepMindعلىعدة معايير، لكنه يبقىيقتصر على استخدام المتصفحوآخرونيتطلب اشتراكًا متميزًا بقيمة 200 دولار شهريًا.
تمت دراسة التداعيات الأمنية بواسطة OpenAI، كما توضح الشركة الأمريكية على مدونتها. نفذت الشركة ضمانات لمنع الاستخدام الضار، بما في ذلك تدريب النموذج على طلب التأكيد قبل تنفيذ الإجراءات ذات العواقب الخارجية.
سيقوم عملاء الذكاء الاصطناعي بتغيير أجهزة الكمبيوتر والهواتف الذكية لدينا
يعد وصول عملاء الذكاء الاصطناعي هؤلاء خطوة مهمة للغاية. يمكن الآن تفويض المهام اليومية مثل حجوزات المطاعم أو إدارة التسوق إلى الذكاء الاصطناعي، من أجل توفير الوقت للأنشطة ذات القيمة المضافة الأعلى.
يوضح مثال ياش كومار، الباحث في OpenAI، هذه الإمكانية بشكل مثالي: فهو يستخدم المشغل لإدارة حجوزات مطعمه تلقائيًا، وهي مهمة بسيطة ولكنها تستغرق وقتًا طويلاً ويمكن الآن تشغيلها آليًا بالكامل.
ومع ذلك، فمن المهم أن نلاحظ أن هذه التكنولوجيا لا تزال في مهدها. وكما يشير سام ألتمان نفسه، يتعين علينا أن نخفف من توقعاتنا وألا نستسلم للضجيج الإعلامي. تظل الأخطاء ممكنة ولا تزال الأداة بحاجة إلى التحسين.
أعلنت شركة سامسونج هذا الأسبوع عنجالاكسي اس 25منيدمج أيضًا وكيل الذكاء الاصطناعي المعتمد على Google Gemini، يمكنك أيضًا السماح لهاتفك الذكي بتنفيذ إجراءات على التطبيقات، دون لمس أي شيء.