رفعت منصة التواصل الاجتماعي الشهيرة ريديت (Reddit) دعوى قضائية ضد شركة بيربلكسيتي للذكاء الاصطناعي (Perplexity AI)، متهمةً إياها وشركاءها بتنفيذ خطة واسعة النطاق لـ “سرقة” محتوى المستخدمين من أجل تدريب وتغذية محرك الإجابات الخاص بالذكاء الاصطناعي لديها.
هذه الدعوى، التي رُفعت في محكمة فيدرالية في نيويورك، لا تستهدف بيربلكسيتي فحسب، بل تشمل أيضًا ثلاث شركات متخصصة في جمع البيانات (Data–Scraping Firms) وهي Oxylabs UAB، وAWMProxy، وSerpApi، متهمة إياهم بإنشاء “اقتصاد غسيل بيانات” على مستوى “صناعي” (Industrial–scale ‘data laundering‘ economy).
⚖️ جوهر الاتهامات
تتلخص مزاعم ريديت الرئيسية في النقاط التالية:
- السرقة الممنهجة للمحتوى: تدعي ريديت أن بيربلكسيتي، بالتعاون مع الشركات الأخرى، استخدمت أدوات خاصة لـ تجاوز الحواجز التقنية والحماية الخاصة بريديت، بالإضافة إلى التحايل على ضوابط محرك بحث جوجل لـ استخراج محتوى ريديت مباشرة من صفحات نتائج البحث الخاصة به، وذلك لجمع بيانات المستخدمين الضخمة على المنصة.
- الحاجة الماسة للبيانات: تؤكد ريديت أن محتوى منصتها هو أحد أكبر وأكثر المجموعات ديناميكية للمحادثات البشرية على الإنترنت، مما يجعله موردًا “يائسًا” (desperately needed) لشركات الذكاء الاصطناعي لتغذية نماذجها.
- تجنب الاتفاقيات الشرعية: تشير ريديت إلى أنها أبرمت اتفاقيات ترخيص مدفوعة مع شركات كبرى في مجال الذكاء الاصطناعي مثل جوجل وOpenAI للوصول إلى بياناتها بطريقة مشروعة تضمن حقوق المستخدمين. وتتهم الدعوى بيربلكسيتي باختيار شراء أو استخدام “بيانات مسروقة” من شركات الجمع بدلاً من الدخول في اتفاق قانوني مع ريديت.
- دليل “الفخ” (Test Post): تزعم ريديت أنها وضعت “منشورًا اختباريًا” مخفيًا، كان متاحًا فقط لبرامج زحف جوجل، وظهر محتواه في نتائج بيربلكسيتي في غضون ساعات، مما يدل على اعتماد الشركة على البيانات المجمعة من نتائج بحث جوجل لتغذية محركها.
🗣️ رد بيربلكسيتي
من جانبها، دافعت بيربلكسيتي عن موقفها بالقول إنها لم تتلق بعد الدعوى القضائية، ولكنها “ستقاتل دائمًا بقوة من أجل حقوق المستخدمين في الوصول بحرية وعدالة إلى المعرفة العامة”. وقد أوضحت الشركة في بيانها:
- لا تُدرّب النماذج التأسيسية: صرّحت بيربلكسيتي بأنها لا تُدرّب نماذج الذكاء الاصطناعي التأسيسية (Foundation Models) على المحتوى، بل تعمل كطبقة تطبيق (Application-Layer) تُقدم الإجابات مع الاستشهاد بالمصادر (بما في ذلك ريديت) لتمكين المستخدمين من التحقق من دقة الإجابة ومتابعة المصدر.
- ليست لديها القدرة على الترخيص: أكدت الشركة أنها أوضحت لريديت سابقًا أنه من المستحيل عليها توقيع اتفاقية ترخيص لتدريب النماذج لأنها لا تقوم بذلك أصلاً، لكن ريديت أصرّت على الدفع.
- مبدأ الإنترنت المفتوح: وصفت بيربلكسيتي الدعوى بأنها “مثال محزن لما يحدث عندما تصبح البيانات العامة جزءًا كبيرًا من النموذج التجاري لشركة عامة”، واعتبرت مطالب ريديت “عكس ما يمثله الإنترنت المفتوح”.
🌐 انعكاسات القضية
هذه الدعوى القضائية هي جزء من موجة متنامية من التحديات القانونية التي يواجهها قطاع الذكاء الاصطناعي من قبل مالكي المحتوى، وقد تساعد في ترسيم المعايير القانونية لاستخدام البيانات المتاحة للعامة على الويب لتدريب نماذج الذكاء الاصطناعي.
تطالب ريديت بتعويضات مالية غير محددة وأمر محكمة دائم يمنع بيربلكسيتي من استخدام محتواها. ويُنظر إلى القضية على أنها معركة محورية حول ملكية “الحوار البشري” عبر الإنترنت وقيمته السوقية في عصر الذكاء الاصطناعي.
Techland Blog Techland Blog