أصدرت OpenAI أداة جديدة تعتمد على الذكاء الاصطناعي: فهي تسمح لك بإنشاء نماذج ثلاثية الأبعاد من النص، مثل Dall-E مع الصور أو ChatGPT مع النص. الذكاء الاصطناعي الذي يمكنه مساعدة المبدعين في إنتاجاتهم ثلاثية الأبعاد.
أعلنت شركة OpenAI عن إطلاق أداة جديدة لإنشاء الصور: Point-E، والتي يمكنها إنشاء سحب نقطية ثلاثية الأبعاد من النص. الشركة الناشئة مرتبطة بإيلون موسك ومتخصصة فيالذكاء الاصطناعيتكرار لذلك بعددال-EوآخرونChatGPTوالتي لاقت نجاحًا كبيرًا في الأشهر الأخيرة، حيث أن الاستخدامات الممكنة مثيرة للإعجاب.
ووفقا للفريق بقيادة أليكس نيكول، "يمكن لـ Point-E في كثير من الأحيان إنتاج أشكال ثلاثية الأبعاد متسقة وعالية الجودة للاستعلامات المعقدة»، وهو أيضًا ملون. إذا لم تكن أفضل أداة موجودة، فإن مبتكريها على يقين من أنها الأسرع على الإطلاق.
الذكاء الاصطناعي الذي يتطلب موارد أقل بكثير من غيره لإنشاء كائنات ثلاثية الأبعاد
بالنسبة لمهندسي OpenAI، فإن أعظم إنجاز لأداتهم هو سرعتها وبالتالي قوة الحوسبة المنخفضة التي تمكنها من العمل. في مقال علمي يوضحون أنه بالنسبة لتوليد كائنات ثلاثية الأبعاد عبر النص، “تتطلب الأساليب الأحدث عمومًا عدة ساعات من العملGPUلإنتاج عينة واحدة". وهو أمر كثير عندما نرى أن Dall-E يمكنه إنشاء صور في بضع ثوانٍيمكن لـ Meta أيضًا إنشاء مقاطع فيديو.
لذلك قررت OpenAI استخدام طريقة بديلة "والتي تنتج نماذج ثلاثية الأبعاد خلال دقيقة أو دقيقتين فقط على وحدة معالجة رسومات واحدة". حتى الآن، تم تدريب Point-E على ملايين النماذج ثلاثية الأبعاد، والتي يمكن تحويلها إلى تنسيق كمبيوتر قياسي.
قيل لنا أن الذكاء الاصطناعي يقوم أولاً بإنشاء عرض فريد باستخدام نموذج تحويل النص إلى صورة (مثل Dall-E). من هذه الصورة التي تم إنشاؤها يقوم البرنامج بإنشاء نقاط ثلاثية الأبعاد. وفي نهاية هذه الخطوة يتضمن النموذج 1024 نقطة، يقوم البرنامج بعد ذلك بتحسينها ليصل إلى 4096 نقطة.
لماذا يكون أداء Point-E أفضل من الذكاء الاصطناعي الآخر؟
تستغرق هاتان الخطوتان بضع ثوانٍ فقط بشكل مستقل، مما يسمح لك بإنشاء نماذج ثلاثية الأبعاد بشكل أسرع بكثير. تهدف Point-E إلى الجمع بين مزايا طريقتين للتوليد:
- الأول يتكون من تدريب نماذج توليد ثلاثية الأبعاد من البيانات المقترنة؛
- والثاني يستخدم نماذج تحويل النص إلى صورة مدربة مسبقًا لتمثيل هذه الصور بشكل ثلاثي الأبعاد.
ومن خلال فصل نفسها عن الأبعاد الثلاثية، تمكنت Point-E على وجه التحديد من تقليل قوة الحوسبة اللازمة، على عكس ما تفعله أنظمة الذكاء الاصطناعي التجريبية الأخرى حاليًا. وعلى الرغم من أن البرامج الأخرى قادرة على توليد عناصر ثلاثية الأبعاد، إلا أن المطورين يوضحون أن المشكلة الرئيسية التي واجهتهم هي "إجراءات التحسين»، والتي تتطلب الكثير من الموارد الرسومية. وهذا ما يمنع إنشاء أدوات عملية.
القوة الكبيرة الأخرى لـ Point-E هي أنها تستخدم الصور كقاعدة تدريب، وليس كائنات ثلاثية الأبعاد: فهذه الأخيرة متوفرة بكميات أكبر بكثير. وهذا ما يسمح لها بإنشاء عناصر من جميع الأنواع ومن أوصاف أكثر تعقيدًا.
يمكن أن تُحدث Point-E ثورة في إنشاء محتوى ثلاثي الأبعاد وبالتالي مساعدة المصممين في عملهم، سواء للسينما أو لألعاب الفيديو. يمكننا أن نتخيل التكامل في محرك اللعبة، مثلمحرك غير واقعي، والتي من شأنها أن تجعل من الممكن دمج الكائنات التي تم إنشاؤها في بضع ثوان في عالم افتراضي، بناء على وصف نصي.
خاصة وأن ميزتها التنافسية هي بلا شك الأكثر عملية: وهي سرعة التنفيذ. مقابله، لدينا أيضًا DreamFusion منجوجل، والتي تتمتع أيضًا بقوة مذهلة في هذا المجال.
بما فيه الكفاية للمساعدة في خلقmetaverseوبشكل أعم من الكون إلىالواقع الافتراضي/ الواقع المعزز. في الوقت الحالي، لا يزال البرنامج له حدود. أولًا، يظل تعريف الكائنات المولدة ضعيفًا جدًا، لكن المهندسين لديهم أفكار.
من الواضح أن هناك تحيزات يمكن أن تكون أدوات الإنشاء التلقائي ضحية لها، وهذا هو السبب جزئيًا في عدم إمكانية الوصول إلى Point-E للجميع على موقع OpenAI. يمكننا أن نطلب من هذا الذكاء الاصطناعي إنشاء خطة أسلحة على سبيل المثال، والتي يجب تجنبها بأي ثمن. ومع ذلك، تم وضع Point-E على الإنترنتجيثبويمكن للجميع الاطلاع على محتوى المشروع منذ وجودهمفتوح المصدر.