أفادت صحيفة نيويورك تايمز الأمريكية بأن شركة OpenAI قامت بتدريب نموذجها الجديد GPT-4 على محتوى يوتيوب، وهو أمر أثار تساؤلات قانونية حيث استخدمت الشركة آلية Whisper لتحويل الصوت في مقاطع الفيديو إلى نصوص لتدريب النموذج.
على الرغم من أن هذا الإجراء يثير بعض القلق من الناحية القانونية، إلا أن OpenAI ترى أنه استخدام مشروع للبيانات.
وقد شارك رئيس OpenAI، جريج بروكمان، شخصيا في جمع البيانات من يوتيوب للاستخدام في التدريب.
وأكدت المتحدثة باسم الشركة، ليندساي هيلد، أن OpenAI تعتمد على مصادر متعددة للبيانات، بما في ذلك البيانات العامة والشراكات.
عام 2021، قامت الشركة بتدريب نماذجها على مصادر بيانات مختلفة، بما في ذلك الأكواد على Github والمحتوى التعليمي على منصة Quizlet.
على الرغم من أن بعض الأشخاص في جوجل كانوا على دراية بنشاط OpenAI، إلا أنهم لم يتدخلوا، حيث أكدت جوجل أنها تستخدم مقاطع الفيديو بموافقة منشئي المحتوى.
وحديثًا، حذر الرئيس التنفيذي ليوتيوب شركة OpenAI من استخدام نموذجها لتحويل النصوص إلى فيديوهات مقتطعة من محتوى المنصة.
شركة OpenAI تُسجل نموًا هائلًا في إصدار ChatGPT Enterprise