ترسم Google تراجعتين جديدتين من Gemini 2.0 مخصصًا على وجه التحديد للروبوتات. هنا ما تتذكر.
تواصل Google الانخفاضتَوأَملجميع الصلصات.موجود جدا على هواتف أندرويد الذكية، الذكاء الاصطناعي للعملاق الأمريكي الآن يأتي إلى روبوتات تحريك.
وهكذا يرفع قسم DeepMind للشركة الحجاب على نموذجين جديدين من لغة IA المستمدة من Gemini 2.0:
- Gemini Robotics ، نموذج "-language-action" (VLA) ؛
- و Gemini Robotics-ER ، نموذج لغة قائم على اللسان (VLM).
«يسمح هذان النموذجان بمجموعة متنوعة من الروبوتات لأداء عدد أكبر من المهام في العالم الحقيقي أكثر من أي وقت مضى"يشرح جوجل.
تم حظر هذا المحتوى لأنك لم تقبل ملفات تعريف الارتباط وغيرها من التتبعات. يتم توفير هذا المحتوى بواسطة YouTube.
لتكون قادرًا على تصوره ، يجب أن تقبل الاستخدام الذي يتم تشغيله بواسطة YouTube مع بياناتك التي يمكن استخدامها للأغراض التالية: اسمح لنفسك بعرض ومشاركة المحتوى مع وسائل التواصل الاجتماعي ، وتعزيز تطوير وتحسين شركائها ، وعرض الإعلانات الشخصية فيما يتعلق بملف تعريف ملف التعريف الخاص بك ، والتعرف على ملف تعريف إعلاني شخصي ، وقياس أداء الإعلانات والمحتوى وقياس جمهور هذا الموقع(يتعلم أكثر)
من خلال النقر على "أقبل كل شيء" ، فإنك توافق على الأغراض المذكورة أعلاه لجميع ملفات تعريف الارتباط وغيرهاشركاءها.
تحافظ على إمكانية سحب موافقتك في أي وقت. لمزيد من المعلومات ، ندعوك لقراءةسياسة ملفات تعريف الارتباط.
يرتبط شركة Mountain View Giant أيضًا بـ AppTronik ، متخصص في الروبوتات "لدفع الجيل القادم من الروبوتات البشرية».
روبوتات أكثر تفاعلاً وذكية ومهارة
لشرح نهجها ، يسلط Google الضوء على ثلاثة مبادئ رئيسية لنماذج الروبوتات لتصبح مفيدة حقًا للبشر.
بادئ ذي بدء ، يجب أن تكون النماذج "عامللتكيف مع المواقف المختلفة ، لذلك يجب ألا تكون متخصصة في مهمة دقيقة. هنا ، يتضمن Gemini Robotics المهام التي لم يفعلها من قبل ، يعرف كيفية إدارة العديد من التعليمات في نفس الوقت ويستوعب العديد من الكائنات والبيئات الجديدة. تفتخر Google نفسها بتحقيق أكثر من مرتين نتائج أعلى في المعايير التي تقيس هذا النوع من الأداء.
يجب أن يكونوا أيضًا "تفاعلي لفهم الإجابة والإجابة على التعليمات والأسئلة أو التغييرات في بيئتها. هنا ، فإن فهم اللغة الطبيعية بواسطة Gemini 2.0 يشارك بالضرورة.
أخيرًا ، فكرة ""البراعة يُستشهد أيضًا بالروبوتات القادرة على استخدام أيديهم ومتعاملات معهم بعناية. شيء يسهل قوله من فعل روبوت. ذهب، "يمكن أن تعالج روبوتات الجوزاء المهام المعقدة للغاية ، في عدة مراحل ، والتي تتطلب معالجة دقيقة ، مثل طي الأوريغامي أو تغليف وجبة خفيفة في كيس ziploc[مع سحاب.ملحوظة] ».
تم حظر هذا المحتوى لأنك لم تقبل ملفات تعريف الارتباط وغيرها من التتبعات. يتم توفير هذا المحتوى بواسطة YouTube.
لتكون قادرًا على تصوره ، يجب أن تقبل الاستخدام الذي يتم تشغيله بواسطة YouTube مع بياناتك التي يمكن استخدامها للأغراض التالية: اسمح لنفسك بعرض ومشاركة المحتوى مع وسائل التواصل الاجتماعي ، وتعزيز تطوير وتحسين شركائها ، وعرض الإعلانات الشخصية فيما يتعلق بملف تعريف ملف التعريف الخاص بك ، والتعرف على ملف تعريف إعلاني شخصي ، وقياس أداء الإعلانات والمحتوى وقياس جمهور هذا الموقع(يتعلم أكثر)
من خلال النقر على "أقبل كل شيء" ، فإنك توافق على الأغراض المذكورة أعلاه لجميع ملفات تعريف الارتباط وغيرهاشركاءها.
تحافظ على إمكانية سحب موافقتك في أي وقت. لمزيد من المعلومات ، ندعوك لقراءةسياسة ملفات تعريف الارتباط.
تشرح Google أيضًا أن هذا النموذج مصمم للتكيف مع جميع أشكال الروبوتات.
لقد رسمنا النموذج بشكل رئيسي على البيانات من منصة روبوتية اثنين من الذراعينألوها 2، لكننا أظهرنا أيضًا أنه يمكنه التحكم في منصة اثنين من الذراعين ، استنادًا إلى أذرع فرانكا المستخدمة في العديد من مختبرات الجامعات. يمكن أن تكون Robotics Gemini متخصصة في الإنجازات الأكثر تعقيدًا ، مثل Apollo Humanoid Robot التي طورتها AppTronik ، من أجل أداء مهام العالم الحقيقي.
التفكير المكاني
أما بالنسبة إلى Gemini Robotics-ER ، فقد تم تصميم هذا النموذج بشكل أكثر تحديداً لتحسين فهم عالم Gemini 2.0. بالنسبة للروبوتات ، تشرح Google أنها تركز بشكل خاص على "التفكير المكاني».
من خلال الجمع بين ذلك في إتقانه للترميز ، يمكن لـ Gemini Robotics-ER تطوير "على الذبابةقدرات جديدة وفقًا لما يراه الروبوت. "" "على سبيل المثال ، عند عرض فنجان القهوة ، يمكن للنموذج تحديد سدادة مناسبة على الإصبعين لفهمه بالمقبض ومسار آمن للتعامل معه».
حجة أخرى ، هذا النموذج "يمكن إجراء جميع الخطوات اللازمة للتحكم في الروبوت بمجرد مغادرة المربع ، بما في ذلك الإدراك وتقدير الحالة وفهم المساحة والتخطيط وتوليد الكود». في مثل هذه السيناريوهات التي يجب أن تدير فيها الذكاء الاصطناعي جميع المهام من البداية إلى النهاية ، يسلط Google الضوء على معدلات النجاح من 2 إلى 3 مرات مما يعرفه الإصدار الكلاسيكي من Gemini 2.0 كيفية القيام به.
توفر Google Gemini Robotics-ER العديد من الشركاء المختارين بعناية حتى يتمكنوا من اختباره وتقديم ملاحظات لتحسينه. تم ذكر الروبوتات الرشيقة ، الروبوتات الرشيقة ، بوسطن ديناميات وأدوات الساحرة الفرنسية.

جوجل الجوزاء