جمعت شركة NVIDIA، التي تبلغ قيمتها السوقية 2.4 تريليون دولار، كميات كبيرة من المحتوى المحمي بحقوق الطبع والنشر من أجل تدريب نماذج الذكاء الاصطناعي. ووفقاً لموقع “Engadget”، طلبت الشركة من موظفيها تنزيل مقاطع فيديو من YouTube وNetflix ومجموعات بيانات أخرى لتطوير مشاريع الذكاء الاصطناعي التجارية.
تعد NVIDIA واحدة من شركات التكنولوجيا التي اعتمدت مبدأ “التحرك بسرعة” في سباقها لتأسيس الهيمنة في مجال الذكاء الاصطناعي. وقد تم استخدام هذه البيانات لتطوير نماذج لمنتجات مثل مولد العالم ثلاثي الأبعاد Omniverse وأنظمة السيارات ذاتية القيادة.
ودافعت NVIDIA عن ممارساتها، حيث قال متحدث باسم الشركة إن أبحاثها “تتوافق تماماً مع روح ونص قانون حقوق الطبع والنشر”. وأضاف أن قوانين الملكية الفكرية تحمي تعبيرات محددة، ولكن ليس الحقائق أو الأفكار أو البيانات أو المعلومات. وشبهت الشركة هذه الممارسة بحق الشخص في “تعلم الحقائق أو الأفكار أو البيانات أو المعلومات من مصدر آخر واستخدامها للتعبير عن نفسه”.
ومع ذلك، لا يبدو أن موقع YouTube يوافق على هذا الرأي، حيث أشار المتحدث باسم الشركة جاك مالون إلى أن استخدام محتوى YouTube لتدريب نماذج الذكاء الاصطناعي يعد “انتهاكاً واضحاً” لشروط الخدمة.
وأفادت التقارير أن موظفي NVIDIA الذين أثاروا مخاوف أخلاقية وقانونية بشأن هذه الممارسة تم إبلاغهم من قبل مديريهم بأن أعلى مستويات الشركة قد وافقت عليها بالفعل. وقال مينج يو ليو، نائب رئيس الأبحاث في NVIDIA: “هذا قرار تنفيذي، لدينا موافقة شاملة على جميع البيانات”. ووصفت بعض الأصوات داخل الشركة هذه العملية بأنها “قضية قانونية مفتوحة” سيتعاملون معها في المستقبل.
بالإضافة إلى مقاطع الفيديو على YouTube وNetflix، أفادت التقارير أن NVIDIA أصدرت تعليمات للعاملين بالتدريب على قاعدة بيانات الأفلام MovieNet، والمكتبات الداخلية لمقاطع فيديو ألعاب الفيديو، ومجموعات بيانات الفيديو على GitHub مثل WebVid وInternVid-10M.
ورغم أن بعض البيانات التي تدربت عليها NVIDIA كانت مؤهلة للاستخدام الأكاديمي فقط، مثل مكتبة HD-VG-130M التي تحتوي على 130 مليون مقطع فيديو من YouTube، تجاهلت الشركة هذه المصطلحات الأكاديمية وأصرت على أن استخدامها كان مشروعاً لتطوير منتجات الذكاء الاصطناعي التجارية.
يوتيوب يواجه مشكلات انقطاع الخدمة لبعض المستخدمين