يُظهر مشروع Google Astra مستقبل البحث متعدد الوسائط... وحاضر OpenAI

يمنحنا نجم Google I/O 2024، Project Astra، لمحة عن المستقبل حيث يمكننا التحدث إلى ما لا نهاية مع مساعد ذكي قادر على التفاعل بناءً على بيئتنا.

يتعرف مشروع أسترا على تجربة قطة شرودنجر الفكرية // المصدر: Google

إذا كنت تتابع Google على الشبكات، فربما تكون قد شاهدته يظهر قبل وقت قصيرمؤتمر OpenAIمقطع فيديو يُظهر مساعدًا صوتيًا متعدد الوسائط قادرًا على الاستجابة في الوقت الفعلي للأسئلة التي تتضمن عنصرًا مرئيًا للبيئة. هذا العرض التوضيحي له الآن اسم: Project Astra.

يوم آخر حتى#GoogleIO! نحن نشعر 😉. نراكم غدًا للحصول على آخر الأخبار حول الذكاء الاصطناعي والبحث والمزيد.pic.twitter.com/QiS1G8GBf9

— جوجل (@جوجل)13 مايو 2024

تم حظر هذا المحتوى لأنك لم تقبل ملفات تعريف الارتباط وأجهزة التتبع الأخرى. يتم توفير هذا المحتوى عن طريق تويتر.
لتتمكن من مشاهدته، يجب عليك قبول الاستخدام الذي يقوم به تويتر لبياناتك والذي يمكن استخدامه للأغراض التالية: السماح لك بعرض المحتوى ومشاركته مع وسائل التواصل الاجتماعي، وتعزيز تطوير وتحسين المنتجات من Humanoid وملحقاتها. الشركاء، عرض إعلانات مخصصة لك فيما يتعلق بملفك الشخصي ونشاطك، وتحديد ملف تعريف إعلاني مخصص، وقياس أداء الإعلانات والمحتوى على هذا الموقع وقياس جمهور هذا الموقع(يتعلم أكثر)

بالنقر على "أقبل الكل"، فإنك توافق على الأغراض المذكورة أعلاه لجميع ملفات تعريف الارتباط وأدوات التتبع الأخرى التي يضعها Humanoid وشركائها.

يمكنك سحب موافقتك في أي وقت. لمزيد من المعلومات، ندعوك لقراءة موقعناسياسة ملفات تعريف الارتباط.

إدارة اختياراتي

المستقبل متعدد الوسائط

لقد أصبح طرح سؤال بسيط على محرك بحث أو مساعد صوتي أو حتى ChatBot الذي يعمل بالذكاء الاصطناعي شيئًا من الماضي. ويتحول المستقبل الآن إلى استعلامات متعددة الوسائط تربط بين سؤال يُطرح كتابيًا أو صوتيًا وعنصر آخر سواء كان صوتيًا أو مرئيًا. الهدف هو جعل البحث أكثر طبيعية والأسئلة أقرب إلى ما يمكن للمرء أن يطرحه على الإنسان. تخيل أنك تسأل "ما هذا؟» إلى مساعد من خلال الإشارة إلى شيء ما بهاتفك الذكي.

يعد Multimodal بالفعل أحد مكونات Gemini، لكن Google تريد الذهاب إلى أبعد من ذلك وإعادة اختراع ما تخيلته أفلام الخيال العلمي بالفعل، مثل جارفيس فيالرجل الحديديأو سامانثا فيها. هذه المهمة هي مشروع أسترا، الذي طورته شركة جوجل ديب مايند. إنه مساعد صوتي قادر على الاستجابة بشكل مستمر وفي الوقت الفعلي وليس فقط لطلب محدد.

سواء من خلال كاميرا الهاتف الذكي أو نموذج أولي للنظارات المتصلة، فإن Project Astra قادر على الإجابة على أسئلة متنوعة مثل "في أي حي أنا؟», «ما الاسم الذي ستعطيه لهذا الثنائي؟», «ماذا تفعل هذه القطعة من التعليمات البرمجية؟» أو حتى «أين وضعت نظارتي؟". نتيجة مبهرة.

جوجل متخلفة؟

لا يكمن هذا الإنجاز في فهم أسترا للعالم بقدر ما يكمن في استجابته. "يعد تقليل وقت الاستجابة إلى مستوى المحادثة تحديًا تقنيًا صعبًا»، تحدد جوجل في بيانها الصحفي. وهذا بالتأكيد هو السبب في أنه لا يزال مجرد مشروع، حتى لو كان تطبيق Gemini سيرث بعض إمكانياته خلال العام.

ومع ذلك، فقد أفسد هذا العرض التوضيحي المثير للإعجابإعلان الأمس عن تحسينات ChatGPT Voice. لا يزال مساعد المحادثة الخاص بـ OpenAI يثبت نفسه في العديد من النقاط، بدءًا من دقة استجاباته، لكنه يظل خطوة إلى الأمام في نقطة واحدة: عرض الصوت. بينما اختارت Google صوتًا لا يزال آليًا إلى حد ما، مشابهًا أو حتى مطابقًا لصوت مساعد Google، يستخدم ChatGPT Voice نغمات وعلامات صوتية أكثر إنسانية وأكثر طبيعية وأقل رتابة. إذا كان البعض سوف يشعر بتأثير "وادي مزعج"، ليس هناك شك في أن هذه حجة مهمة للتبني على نطاق واسع.

بالإضافة إلى ذلك، سيكون الإصدار ألفا من هذه الأداة متاحًا لمشتركي ChatGPT Plus في الأسابيع المقبلة. يعد العام بأن يكون تنافسيًا للغاية في هذا المجال …


نراكم كل يوم أربعاء على Twitch، من الساعة 5 مساءً حتى الساعة 7 مساءً، للمتابعة المباشرةالعرض Survoltésمن إنتاج فراندرويد. سيارة كهربائية، دراجة كهربائية، نصيحة الخبراء، ألعاب أو شهادات، هناك شيء للجميع!

جوجل الجوزاء