ستقوم Google بإنشاء صور أكثر نجاحًا للتنافس مع DALL-E وMidjourney

أصدرت Google الكثير من الإعلانات خلال مؤتمر Google I/O الذي انعقد يوم الثلاثاء 14 مايو. من بينها، Imagen 3: أحدث تطور لنموذج توليد الصور الخاص بها. فهو أفضل في التفسير وأكثر دقة، ويمكنه إنتاج صور أكثر واقعية.

المصدر: مونتاج فراندرويد

بعدصورةكان هناكالصورة 2ثم الصورة 3:جوجلتواصل تكرار نموذج توليد الصور الخاص بها. قامت الشركة في الواقع بإضفاء الطابع الرسمي على الإصدار الثالث من Imagen خلالمؤتمر Google I/Oمباشرة من سان فرانسيسكو في 14 مايو. ومن بين الإعلانات، قدمت جوجل على سبيل المثالAsk Photos، إحدى ميزات Google Photos التي تستخدم Gemini.

ما هو التقدم الذي أحرزته Imagen 3؟

تقدم Google Imagen 3 باعتباره النموذج الأكثر كفاءة لإنشاء الصور من النص، سواء من حيث الجودة أو مستوى التفاصيل. الوعد: صور واقعية/واقعية، وقبل كل شيء "عدد أقل من التحف البصرية المشتتة للانتباه» مقارنة بـ Imagen 2 على وجه الخصوص. تقدم آخر مهم جدًا: إنشاء النص. في الواقع، مولدات الصور غير قادرة من الناحية النظرية على فهم أن الحرف واحد: لذا فإن تمثيل الكلمات أمر معقد للغاية. تعلن Google أنها قامت بتحسين إمكانيات رسم النص لنموذجها بشكل كبير.

الصورة 3 المقدمة خلال Google I/O 2024 // المصدر: google

وتفسر الشركة هذا التقدم بحقيقة أن Imagen 3 أفضل في الترجمة الفورية، و”يفهم» المزيد من النية وراء أاِسْتَدْعَى، خاصةً لأنه يأخذ المزيد من التفاصيل في الاعتبار في الرسائل الأطول.

صورة تم إنشاؤها باستخدام Imagen 3 و"المطالبة" الخاصة بها // المصدر: Google

كما هو الحال مع Imagen 2، لا يمكن استخدام Imagen 3 إلا باللغة الإنجليزية. ذكاء اصطناعي متاح لاختيار منشئي المحتوى في ImageFX، إحدى أدوات الذكاء الاصطناعي التجريبية المتوفرة في AI Test Kitchen من Google. ويحدد الأخير أن Imagen 3 سيكون متاحًا قريبًا على Vertex AI، وهو حل Google Cloud.

ما الاستخدامات والتكاملات لمولد الصور الألف هذا؟

توجد مولدات الصور، حتى المجانية منها، في كل مكان تقريبًا، على الرغم من أنها ليست بالضرورة مدمجة جميعًا في التطبيقات التي نستخدمها. الأكثر تقدما هو بلا شك مايكروسوفت،مع مساعده. من جانب جوجل، لا يمكن استخدام Imagen 2 إلا في ImageFX، وهي أداة تجريبية متاحة (على أساس مقيد) في مطبخ اختبار الذكاء الاصطناعي الخاص بها.

الصورة 3 قابلة للاستخدام في ImageFX // المصدر: Google

ومن بين الاستخدامات التي تصورها جوجل، هناك إمكانية "إنشاء رسائل عيد ميلاد مخصصة وشرائح العناوين في العروض التقديمية" بشكل ملحوظ. وفي عمليات التكامل، جعلت جيميني من الممكن لعدة أشهر إنشاء الصور،الأمر الذي لم يكن خاليًا من العواقب من حيث التنوع. ونحن نعلم ذلك أيضاتعمل Google على دمج منشئ الصور في رسائل Googleعبر ابن chatbot الجوزاء.

للذهاب أبعد من ذلك
الانتخابات الأوروبية: الدور المهم لجوجل

دعونا نأمل أن تصل هذه الأدوات إلى فرنسا، نظرًا للتشريعات الأوروبية، تجد Google نفسها تواجه صعوبة في نشرها في القارة القديمة.