يعترف OpenAI (ChatGPT) بأنه يتعين عليك سرقة المحتوى لإنشاء الذكاء الاصطناعي

وفقًا لـ OpenAI، من الطبيعي والضروري استخدام محتوى محمي بحقوق الطبع والنشر لتدريب GPT AI الخاص بك.

قد يكون عام 2024 هو العام الذي ينتهي فيه الغرب المتوحش بالنسبة للذكاء الاصطناعي التوليدي. بينما Midjourney متورط في اتهامات بالسرقة الأدبيةحوالي 4700 فنان، يجب أن تواجه شركة OpenAIاتهامات من الصحافة حول ChatGPT.

وفي كلتا الحالتين، استخدمت الشركات المحتوى على الإنترنت على نطاق واسع لجعل الذكاء الاصطناعي التوليدي الخاص بها ذكيًا وملائمًا حقًا، حتى لو كان ذلك يعني استخدام محتوى محمي بموجب حقوق الطبع والنشر. سيتعين على المحاكم أن تقرر ما إذا كان هذا استخدامًا مقبولاً أم لا.

سيكون إنشاء الذكاء الاصطناعي بدون الطيران أمرًا مستحيلًا

جاء ذلك في مقال بالصحيفة الإنجليزيةالجارديانيمكننا قراءة رد OpenAI الأول على الاتهام الخطير للغاية من صحيفة نيويورك تايمز. وفقًا للشركة الناشئة المرتبطة بشركة Microsoft في هذا المجال، سيكون من المستحيل ببساطة تصميم أدواتها مثل ChatGPT دون الوصول إلى المحتوى المحمي بموجب حقوق الطبع والنشر.

للتذكير، تعتمد أدوات الذكاء الاصطناعي التوليدية مثل ChatGPT أو Midjourney أو Stable Diffusion علىنموذج اللغة الكبير، أو LLM. للحصول على الذكاء، يجب تدريبهم على مجموعة كبيرة جدًا من البيانات.

ومع ذلك، فإن مبدأ حقوق الطبع والنشر، خاصة في المملكة المتحدة أو الولايات المتحدة، هو أنه يجب أن يكون من المستحيل استخدام العمل لأغراض تجارية دون موافقة أصحاب حقوقه. لم تقم OpenAI بزيارة كل مالك لآلاف المقالات التي استشارتها GPT للتدريب عليها.

ولأن حقوق الطبع والنشر اليوم تغطي تقريبا جميع أشكال التعبير البشري ــ بما في ذلك منشورات المدونات، والصور الفوتوغرافية، ومشاركات المنتديات، ومقتطفات من أكواد البرمجيات، والوثائق الحكومية ــ فسيكون من المستحيل تدريب أفضل نماذج الذكاء الاصطناعي اليوم دون استخدام مواد محمية بحقوق الطبع والنشر.

ونجد في هذا المنطق فلسفة قديمة قدم وادي السيليكون: في بعض الأحيان يتعين عليك أن تتجاهل القانون حتى تتمكن من الابتكار وتصبح كبيرا بالقدر الكافي لإرغام القانون على التكيف. هذه هي المواجهة التي ستحاول شركات الذكاء الاصطناعي التوليدية الجديدة الآن المطالبة بها بأن يصبح الاستخدام غير القانوني، الذي تعترف هي نفسها بأنه قام به للموارد على الإنترنت، قانونيًا.

بمعنى آخر، تود OpenAI أن تكون قادرة على استغلال المحتوى الذي يتطلب استثمارًا بحرية (راتب الصحفيين في حالة منفذ إعلامي على سبيل المثال)، ثم تحقيق مكاسب تجارية من خلال بيع الخدمات حول ChatGPT و Dall-E. .

ومع شعورها بأن موقفها قد يكون من الصعب الدفاع عنه علنًا، لا تزال شركة OpenAI تذكّر ببعض التدابير المتخذة لاحترام وسائل الإعلام. أولاً، توفر الخدمة الآن طريقة لمنع GPT من الوصول إلى بيانات الوسائط عبر الإنترنت. وهو الحل الذي تستخدمه صحيفة نيويورك تايمز منذ صيف عام 2023، لكنه لا يحل مسألة تدريب الذكاء الاصطناعي قبل هذا التاريخ.

بالإضافة إلى ذلك، فإن OpenAI تؤهل "قلس»ما هي الأخطاء التي يمكن لـ ChatGPT القيام بها لإصلاحها. هذه هي إمكانية قيام ChatGPT بتوفير مقتطفات دقيقة كلمة بكلمة من المقالات المدفوعة من صحيفة نيويورك تايمز دون ذكر المصدر المعني. وقد وثقت صحيفة نيويورك تايمز هذه الحقيقة على نطاق واسع في الأدلة المصاحبة لبيان الدعوى.

أخيرًا، وبصرف النظر عن هذه الاستجابة العامة، تسعى OpenAI بشكل أساسي إلى الدخول في شراكات مع المجموعات الإعلامية الرئيسية للحصول على الحق، في إطار حقوق الطبع والنشر هذه المرة، للوصول إلى البيانات. وقد تمكنت الشركة بالفعل من التوقيع معهاوكالة انباء(المعادل الأمريكي لوكالة فرانس برس)، وأكسيل سبرينغر (بيزنس إنسايدر).