يتم الحديث عن Gemini بانتظام، ولكن مع تسميات Google وجميع الأدوات التي تختبرها الشركة وتضعها على الإنترنت، فمن الصعب أن تجد طريقك. هذا الملف موجود هنا لشرح كل ما تحتاج لمعرفته حول Gemini: فيما يتم استخدامه وكيفية استخدامه وما هي خطط Google لمستقبل الذكاء الاصطناعي.
6 ديسمبر 2023،جوجل تعلن عن برج الجوزاء على حين غرة إلى حد ما، الصوت LLM، أنتنموذج لغة كبير، نموذج لغوي كبير بالفرنسية. هذا نموذج منالذكاء الاصطناعيمما يجعل من الممكن السلطةروبوتات الدردشةمثلChatGPT. يقال إن برج الجوزاء في بعض الإصدارات هو "الوسائط المتعددة"، مما يعني أنه يمكنه تفسير عدة أنواع من العناصر: النص والصورة والفيديو وكذلك الصوت. إليك كل ما تحتاج إلى فهمه عن برج الجوزاء.
للذهاب أبعد من ذلك
ما هو ماجستير في القانون؟ كيف تعمل محركات ChatGPT وGoogle Bard وغيرها؟
الجوزاء هو بكل بساطة آخر ماجستير في القانونجوجل، الذي بحسب الأخير قادر بالفعل على الضربجي بي تي-4، ماجستير في القانونOpenAIوالذي يستخدم بشكل أساسي في ChatGPT وما فوقمساعد الطيار. الفكرة هي أنلامداوآخرونبالم-2لم تكن فعالة بما فيه الكفاية: مع Gemini، تريد Google اتخاذ خطوة جديدة ويبدو أن هذا مشروع طويل الأمد.
ويبدو أن هذا الأمر ناجح، حيث أن الإصدار الأول الذي تم الكشف عنه في ديسمبر الماضي تغلب على GPT-4 في 30 من أصل 32 معيارًا أكاديميًا. إنه جيد جدًا في حل مشكلات الرياضيات والفيزياء، ولكنه جيد أيضًا في الفهم، وإن كان أقل في المنطق. ماذا عن المنافسة معجي بي تي-5لكن ؟ سيكون من المثير للاهتمام إجراء المقارنة عندما يكون ذلك ممكنًا.

جوجل الجوزاء
نموذج "الوسائط المتعددة», كيساكو؟
تصف جوجل نموذجها بأنه "الوسائط المتعددة» وهذا هو السبب أيضًا وراء تخلي Google عن نماذج الذكاء الاصطناعي الأخرى. وهذا يعني أنه يمكنه تفسير بيئته بطرق مختلفة وليس فقط من النص: وهذا يشمل كود الكمبيوتر والصوت والصور والفيديو.
يكفي لتوسيع إمكانيات الاستخدام والأداء. وهذا أيضًا هو الفارق الكبير بين GPT-4 وOpenAI، وهو ليس متعدد الوسائط حقًا: وهذا هو التحدي الكبير الذي يواجه مطوره.
ماذا يعني الجوزاء؟
جوجل اسمه الجوزاء بعدشبكة الاستخبارات العامة المتعددة الوسائط. حرفيا يعني "شبكة الاستخبارات العامة المتعددة الوسائط». أنا لست لاتينية،تَوأَموسائل "التوائم»: هذا هو المكان الذي تأتي منه كوكبة الجوزاء. في مجال الحوسبة، يشير الاسم أيضًا إلى بروتوكول الاتصال بين العميل والخادم. تم إنشاؤه ليكون بمثابة خطوة في بناء الويب. بروتوكول يشير في حد ذاته إلى برنامج جيميني التابع لناسا (الذي تحمل سفينته نفس الاسم)، وهو مرحلة وسيطة بين برنامج ميركوري وبرنامج أبولو الشهير. هل يمكن أن يكون برج الجوزاء من Google أيضًا خطوة نحو شيء أكبر؟
ما هي الاختلافات بين جيميني نانو وبرو وألترا؟
الجوزاء مقسم إلى ثلاثةالأحجام» اعتمادًا على عدد مليارات المعلمات التي يتم أخذها في الاعتبار أثناء تشغيلها. كلما زاد الحجم، زادت الموارد التي يتطلبها تشغيل النموذج (أو يستغرق إنشاء الاستجابات وقتًا أطول بكثير).
لذلك هناك:
- جيميني نانو: الأصغر، وهو مصمم للعمل على الأجهزة المحلية، مثل الهواتف الذكية. نفسها مقسمة إلى Nano 1 (1.8 مليار معلمة) و Nano 2 (3.25 مليار)، للتكيف مع ذاكرة الوصول العشوائي للأجهزة؛
- Gemini Pro: نموذج متعدد الاستخدامات يمكن نشره في التطبيقات؛
- Gemini Flash: إصدار فائق السرعة، مصمم للتطبيقات التي ترغب في استخدام Google API؛
- Gemini Ultra: أقصى ما يمكن أن تفعله Google.
منذ مؤتمر Google I/O الأخير، الإصدار الأكثر تقدمًا هو Gemini 1.5 Pro، والذي يوفر قدرة معالجة تصل إلى مليون رمز، وهو ما يزيد بكثير عن 32000 رمز في Gemini 1.0 Pro.
كيفية التنقل في تسميات Google: أصبح Bard هو Gemini
في بداية النص التوليدي للذكاء الاصطناعي، كان هناك Google Bard. لقد كان برنامج chatbot من Google يعمل بنظام PaLM-2. أداة قدمت خلالمؤتمر جوجل آي/أو 2023والذي ظل تجريبيًا طوال حياته قبل أن يتحول إلى برج الجوزاء. منذ ديسمبر الماضي، اختفى بارد (التطبيق، الموقع، الإشارات من جوجل) من اتصالات الشركة لصالح برج الجوزاء. حتىمساعد التطبيق مع باردتم استبداله ببساطة بالجوزاء. قد يكون تغيير الاسم مرتبطًالأخطاء بارد الفادحة أثناء عرضه:لقد تسببوا في خسارة جوجل 100 مليار دولار.
علاوة على ذلك،استثمرت جوجل الكثير من الأموال في الأنثروبيك، وهي شركة ناشئة متخصصة في الذكاء الاصطناعي، تقوم بتسويق برنامج الدردشة الآلي الخاص بها، والذي يسمىكلود آي.
سيحل Gemini محل مساعد Google
تغيير التكنولوجيا وتغيير الاسم: هذا ما تهدف إليه Googleمساعد جوجل. ابنمساعد صوتيتم إطلاقه في عام 2016 ولم يكن مقنعًا أبدًا، ويبدو أن تطويره قد توقف لبعض الوقت. في الواقع، لم تظهر أي تطورات جديدة كبيرة هذا العام. والأسوأ من ذلك:تمت إزالة بعض الميزات بواسطة Google.
ومع ذلك، فإن التقدم التكنولوجي الذي حققته Google موجود مع برج الجوزاء. ما يجب على Google فعله هو التخلص تمامًا من مساعد Google لصالح Gemini. يمكن أن يكون الأخير مساعدًا صوتيًا أفضل، حيث يسمح تصميمه بتقديم أداء أفضل “لفهم» طلبات المستخدمين والرد عليها. الخطوة التالية: إطلاق ميزة الدردشة الصوتية على جيميني، مثلدردشةGPT صوت.
جيما: النسخة "يفتح» من الجوزاء
فبراير الماضي،أطلقت جوجل جيما، عائلة من LLMs مبنية على تلك الموجودة في الجوزاء. الهدف: بيع حلولها السحابية لمواجهة أمازون ومايكروسوفت. يمكن استخدام جيما مجانًا وهي "تم تصميمها باستخدام نفس العناصر التقنية والبحثية والبنية التحتية المستخدمة لإنشاء نماذج الجوزاء". جوجل حتى يجادل بأن "تتميز Gemma بأداء الأفضل في فئتها مقارنة بالنماذج المفتوحة الأخرى بالنسبة لحجمها.»
وبالتالي، هناك Gemma 2B وGemma 7B (لمعلمات 2 و7 مليار). بل من الممكن أنقم بتشغيل Gemma على جهاز الكمبيوتر الخاص بك محليًاعلى سبيل المثال عبرChatRTX، برنامج من Nvidia يسمح لك باستخدام LLMs.
كيفية استخدام الجوزاء؟
جوجل تلتزم، الجوزاء تتدخل تدريجياً في كل مكان في خدماتها. فيما يلي بعض نقاط الوصول إلى chatbot.
الطريق لمساعد الجوزاء
يتوفر وكيل المحادثة Google Gemini، الذي كان يُعرف سابقًا باسم Google Bard، على المتصفح (gemini.google.com)، ولكن ليس عبر تطبيق الهاتف الذكي حتى الآن. يستخدم برنامج الدردشة الآلي هذا برنامج Gemini Pro، وهو الإصدار المتوسط من LLM. لكن في الوقت الحالي، من المستحيل تنزيل تطبيق Gemini في فرنسا وذلك لسبب وجيه: لأسباب أمنية.اللائحة العامة لحماية البيانات، جوجل لم تطلق مساعدها في الاتحاد الأوروبي.
حاليًا، يستخدم Gemini (مع اشتراكه المتقدم).الجوزاء برو 1.5، نسخة من Gemini قريبة من Gemini 1.0 Ultra، والتي تتمتع بقدرة معالجة كبيرة: مليون رمز، مقارنة بـ 128000 لـ GPT-4. يكفي للسماح للمساعد بتحليل كميات كبيرة جدًا من المعلومات، مثل 10 ساعات من الفيديو أو عشرات الآلاف من أسطر التعليمات البرمجية.
على بكسل 8
الجوزاء نانو متاح علىبكسل 8وآخرونبكسل 8 برو,كل ذلك محليا: يتم تنفيذ جميع العمليات على الهاتف الذكي وليس على خوادم Google. يكفي عدم الحاجة إلى اتصال بالإنترنت وإرسال المعلومات إلى Google.
يتيح لك المساعد إنشاء ردود تلقائية في المحادثاتواتساب(باللغة الإنجليزية فقط) منذ ذلك الحينكلافيير جي بورد. للقيام بذلك، يقوم Gemini Nano بمراجعة المحادثة، ولا تظهر سوى الشاشة. يتوفر تطبيق WhatsApp فقط في الوقت الحالي، ولكن ستصل التطبيقات الأخرى لاحقًا. في مسجل الصوت (Pixel Recorder)، يمكنك أن تطلب من Gemini تلخيص المحادثة.
على كروم
فيالكروم، يمكنك كتابة "@تَوأَم» في شريط العناوين الموجود أعلى الشاشة متبوعًا باستعلامك. لذا، يبدأ موقعgemini.google.com باستعلامك الذي يستجيب له.
في رسائل جوجل
المساعد حتىيمكن الوصول إليها من رسائل جوجل: فيتطبيق الرسائل القصيرة / رسائل الوسائط المتعددةمن Google، هناك نقاش مع Gemini بين بعض المستخدمين. يكفي أن تطلب منه كتابة رسالة نصية قصيرة مهمة، وإنشاء صور لإرسالها إلى أصدقائه، وما إلى ذلك.
ولكن يمكنك بالتأكيد استخدام هذا الإصدار من Gemini (الأقل قوة من المساعد المعتمد على المتصفح) لطلب أي شيء وكل شيء: وصفة طبخ، وموضوعات محادثة للأمسية القادمة، وما إلى ذلك. في الوقت الحالي، لا يتم التخطيط للتكامل للمستخدمين في الاتحاد الأوروبي.
في Google Workspace
يريد الجوزاء أن يصبح أداة إنتاجية حقيقية، ومساعد عمل، وكلية مثالية. وفي هذا السياق تسعى Google إلى نشره في مجموعة Workspace الخاصة بها، وإصدار الاشتراك والأعمال من Gmail وDrive وDocs وSheets وما إلى ذلك. على سبيل المثال،سيتمكن Gmail من قراءة رسائل البريد الإلكتروني الخاصة بك وفرزها وكتابتها وتنظيمها إذا طلبت ذلك.
يمكن أيضًا استدعاء روبوت الدردشة في محادثات Google Chat، مما يغذي عمل فريق كامل في المشروع (المستندات، والمناقشات، والتقويمات، وما إلى ذلك). الميزة لها اسم أكثر تحديدًا:زميله في منظمة العفو الدوليةوتبدو واعدة جدًا.
الجوزاء على اي فون؟
على الرغم من عدم توفر تطبيق Gemini على متجر التطبيقات، إلا أنه من الممكن أن تقدم Google مساعدها إلى متجر التطبيقاتايفون. وفقا للشائعات،ستتفاوض شركة Apple مع Google لتتمكن من استخدام Gemini على نظام التشغيل iOS. ترغب الشركة المصنعة للهواتف الذكية في دمج الذكاء الاصطناعي التوليدي في أسرع وقت ممكن في نماذجها التالية. يكفي الاستعلام عن برنامج chatbot مباشرة على نظام iOS، دون الحاجة إلى المرور عبر تطبيق أو موقع ويب.
سيكون هذا أيضًا أحد الميزات الجديدة الكبيرة لنظام التشغيل iOS 18، والذي يتشكل بالفعل ليكون تطورًا مهمًا لنظام تشغيل iPhone. الرد في يونيو المقبل خلالالمؤتمر العالمي للمطورين 2024، خلالهاتفاحةسيتم رفع الحجاب عن خليفة iOS 17، قبل أشهر قليلة من تقديم iPhone 16.
ما الذي يستطيع Google Gemini فعله؟
الذكاء الاصطناعي من Google قادر على إنجاز العديد من المهام لدرجة أنه من المستحيل إدراجها جميعًا. لمعرفة المزيد، ندعوك للقراءةملفنا حول استخدامات ChatGPTوالتي يمكن أن تنطبق أيضًا على برج الجوزاء.
ملخصات النص
مثل العديد من برامج الدردشة الآلية الأخرى، تعد Gemini أداة جيدة جدًا لتلخيص المحتوى النصي. رسائل البريد الإلكتروني والمقالات وملفات المستندات: نظرًا لدمجها في خدمات وأجهزة Google، أصبحت إمكانيات الملخصات النصية أكبر وأكبر. قريبا مثلازر "تلخيص هذا البريد الإلكتروني» سوف تظهرفيتطبيق جيميل.
في الوقت الحالي، تتوفر الميزة بالفعل في بعض البلدان في إصدار متصفح Gmail لمستخدمي Workspace فقط. الميزة هي أننا سنكون قادرين على تلخيص سلاسل رسائل البريد الإلكتروني وليس فقط رسائل منفصلة: وهو ما يكفي لفهم جوهر المناقشة التي لم نشارك فيها، ولكن تم نسخنا فيها.
التدريب الرياضي
في الوقت الحالي، تعتبر نصائح التدريب الرياضي تجريبية ولن يتم تطبيقها على الفور. على أية حال،أعلنت Google بالفعل عن وصول Fitbit Labs، مجموعة من الميزات المبنية على برج الجوزاء، مثل برنامج الدردشة الآلي والمدرب الافتراضي. سيتم بطبيعة الحال دمج Fitbit Labs فيتطبيق فيتبيت، مخصص للساعات والأساور المتصلة بالعلامة التجارية.
سيتمكن برنامج الدردشة الآلي من إنشاء رسوم بيانية تتعلق بالعديد من البيانات (مثل نشاط اليوم ونوعية النوم في الليلة التالية). هذا "مدرب» سيكون أيضًا قادرًا على برمجة التدريبات الشخصية بناءً على البيانات الصحية الحالية. ميزة يجب حجزها للمستخدمين المشتركين في Fitbit Premium.
امتدادات الجوزاء
في إصدار المتصفح من chatbot، كان هناك مؤخرًانظام التمديد، متوفر في فرنسا. يتيح ذلك لروبوت الدردشة الاتصال بخدمات Google الأخرى: Google Flights، وGoogle Hotels،خرائط جوجل,يوتيوببالإضافة إلى مجموعة Workspace (المستندات، وجداول البيانات، وما إلى ذلك). الفكرة هي أن تكون قادرًا على ذلكاستدعاء» هذه الملحقات عند كتابة استعلام، بحيث يقوم Gemini بجلب المعلومات من خدمات Google الأخرى. يكفي أن يكون لديك رابط لرحلات الطيران أو الخرائط أو حتى موقع YouTube. بالنسبة إلى الميزات المتعلقة بـ Google Workspace، يجب عليك منح حقوق الوصول إلى Gemini، حتى يتمكن من الاطلاع على رسائل البريد الإلكتروني والمستندات الخاصة بك.
يمكن تعطيل هذه الملحقات في أي وقت في إعدادات خصوصية المساعد. في الوقت الحالي، لا تتوفر أي تطبيقات تابعة لجهات خارجية، ولكن يمكننا المراهنة على أنه سيكون هناك متجر ملحق في المستقبل،مثل تلك التي تقدمها ChatGPT. نعلم أيضًا أن YouTube Music سيصل قريبًا جدًا. لاحقًا، سيأتي دور تقويم Google ومهام Google وGoogle Keep لتصبح امتدادات لـ Gemini.
كشف عمليات الاحتيال على هاتفك الذكي
في المستقبل القريب، سيتمكن Gemini Nano من اكتشاف المحادثات الهاتفية التي يعتبرها احتيالية والتي تبدو وكأنها عمليات احتيال إلى حد كبير. في هذه الحالة، يعمل LLM مباشرة على هاتفك الذكي، دون الاتصال بخدمات Google.
وفي حالة اكتشاف محادثة غريبة، سيتم عرض رسالة منع. لا نعرف ما هي الطرازات التي سيكون هذا متاحًا لها: من الممكن أن يحدث ذلك فقط لأجهزة Pixel، أو على أجهزة معينة ضمنأندرويد 15.
العثور على أي من الصور الخاصة بك
الميزات القادمة الأخرى المدعومة من الجوزاء:اسأل الصور، في صور جوجل. سيوفر إمكانية البحث عن المحتوى في الصورة بطريقة دقيقة للغاية. سواء كانت لوحة ترخيص أو طبقًا (مع الوصفة)، يجب أن يكون الجوزاء قادرًا على العثور على كل شيء.
بالإضافة إلى ذلك، سيتمكن روبوت الدردشة من اختيار مجموعة مختارة من الصور التي طلبتها: على سبيل المثال، جميع صور طفلك وهو يسبح.
ما لا يستطيع chatbot القيام به
حديثةدراسة أجرتها المنظمة غير الحكومية الدولية لتقارير الديمقراطيةوأشار إلى أن جيميني، مثل برامج الدردشة الأخرى، لم تتمكن من تقديم معلومات دقيقة حول الانتخابات الأوروبية. إنهم يفشلون في شرح كيفية عمل التصويت وتوليد المعلومات من بيانات قليلة.
للذهاب أبعد من ذلك
الانتخابات الأوروبية: الدور المهم لجوجل
الجوزاء، من جانبه، يقوم بشكل أساسي بصياغة الإجابات غير الصحيحة ويشجع المستخدمين على البحث عن المعلومات في مكان آخر. هذا المثال معزول بالتأكيد، لكنه يظهر أحد حدود برج الجوزاء. علاوة على ذلك، قررت جوجل في شهر مارس الماضي:لن تقدم شركة جيميني بعد الآن معلومات عن الانتخابات الأوروبية. وبصرف النظر عن ذلك، فإننا نعلم أنه قريبا،قد يتذكر الجوزاء ما تريد أن تقوله له، كما كان ChatGPT يفعل لبعض الوقت.
استمتع بالإصدار الأكثر تقدمًا من Gemini من خلال اشتراك Google
خلال مؤتمر Google I/O الأخير، تم إطلاق Googleالجوزاء المتقدم: هذه نسخة من اشتراك Google One مصممة خصيصًا لأدوات الذكاء الاصطناعي الخاصة بالشركة. فهو يشمل جميع مزايا خطة Google One Premium، ولكن ليس ذلك فحسب. وبهذا نستفيد من مساحة تخزين تبلغ 2 تيرابايت على حساب Google (بدلاً من 15 جيجابايت للحساب المجاني)، ولكن أيضًا وقبل كل شيء من دمج Gemini في خدمات Google، بالإضافة إلى إمكانية استخدام Gemini Advanced، وهي Gemini 1.5 Pro (الإصدار الأكثر تقدمًا من LLM). تبلغ تكلفة الاشتراك 21.99 يورو شهريًا وتقدم Google عرضًا تجريبيًا لمدة شهرين.
وتحدد جوجل في موقعها أن "يعد Gemini Advanced أكثر فعالية في المهام المعقدة للغاية مثل البرمجة والتفكير المنطقي واتباع تعليمات محددة والتعاون الإبداعي.»
للذهاب أبعد من ذلك
Gemini Advanced: ما هو هذا الإصدار النهائي من chatbot مع Gemini 1.5 Pro؟
لكن كن حذرًا: يتوفر Gemini Advanced ومُحسّن باللغة الإنجليزية فقط، حتى لو كان بإمكانه الاستجابة باللغة الفرنسية. وبالنسبة إلى Gemini في Gmail أو المستندات أو العروض التقديمية، فهي باللغة الإنجليزية الأمريكية فقط. سيوفر الاشتراك قريبًا إمكانية الوصول إلى الميزات الحصرية. من بينها، هناك Gemini Live، الذي يسمح لك بالدردشة مع برنامج الدردشة الآلي كما تفعل مع شخص حقيقي. بداهة، يمكن مقاطعته ويمكننا أن نطلب منه تغيير صوته بسرعة. يمكننا أيضااستخدم الكاميرا الحية للتفاعل مع الجوزاء. سيكون برنامج الدردشة الآلي أيضًا بمثابة دليل للرحالة يخطط لرحلتك وفقًا لأذواقك ورغباتك.
وتخطط جوجل أيضًا لإطلاق شخصيات الجوزاء والجواهر التي يمكنك إنشاؤها بنفسك، مثل “صديق في صالة الألعاب الرياضية، أو مساعد الطاهي، أو شريك البرمجة، أو دليل الكتابة الإبداعية»، يحدد الشركة.
لماذا الجوزاء محدود جدًا في فرنسا؟
لا تتوفر العديد من ميزات الجوزاء في فرنسا، وبشكل عام في الاتحاد الأوروبي. إن التشريعات الأوروبية هي التي تمنع جوجل من إطلاق أدوات الذكاء الاصطناعي الخاصة بها في القارة القديمة. أولًا، هناك حماية البيانات: لكي يتقدم برج الجوزاء، يجب عليه استخدام المحادثات التي يجريها مع مستخدميه، الأمر الذي قد يشكل قلقًا بشأن حماية بيانات مستخدمي chatbot.
ثم،قانون الأسواق الرقمية: إذا قامت Google بنشر Gemini على نطاق واسع، فقد تضطر الشركة إلى جعلها تحترم قواعد معينة. ومن بين أمور أخرى، لم يعد بإمكان Gemini الاستفادة من خدمات Google الأخرى (YouTube، والخرائط، وWorkspace، وما إلى ذلك). ومع ذلك، هنا تكمن كل قوة الأداة: القدرة على الاتصال بخدمات الشركة الأخرى.
وأخيرا، هناكقانون الذكاء الاصطناعي: النص الذي وافق عليه البرلمان في مارس الماضي، والذي يهدف إلى تنظيم الذكاء الاصطناعي التوليدي بشكل خاص. ومن المقرر أن يتم التصديق عليه رسميا بحلول يوليو المقبل. نص من شأنه أن يجبر Google على الكشف عن أسرار جيميني للمفوضية الأوروبية (المحتوى المستخدم للتدريب والخوارزمية وما إلى ذلك)، لإجبارالعلامة المائيةالمحتوى الذي تم إنشاؤه بواسطة الأداة (تأكد من إمكانية تحديد النصوص والصور على أنها مصطنعة).

جوجل الجوزاء

جوجل الجوزاء