أعلنت شركة Stability AI، الرائدة في مجال الذكاء الاصطناعي، عن إطلاق نموذج جديد مفتوح المصدر لتوليد الأصوات، أطلقت عليه اسم “Stable Audio Open”. وأوضحت الشركة في بيانها الرسمي أن هذا النموذج قد تم تدريبه باستخدام تسجيلات خالية من حقوق الملكية، مستندة إلى حوالي 486 ألف عينة من مكتبات الأصوات المفتوحة المصدر مثل FreeSound وFree Music Archive.
ويعمل نموذج “Stable Audio Open” على تحويل المطالبات النصية إلى تسجيلات صوتية يصل طولها إلى 47 ثانية. وتؤكد الشركة أن هذا النموذج يمكن استخدامه لإنشاء أصوات لمجموعة متنوعة من الأغراض، بما في ذلك الأفلام والبرامج التلفزيونية.
وأضافت Stability AI أن إحدى الفوائد الرئيسية لهذا الإصدار المفتوح المصدر هي إمكانية تحسين المستخدمين للنموذج باستخدام بياناتهم الصوتية المخصصة. فعلى سبيل المثال، يمكن للمستخدم تحسين النموذج بناءً على عينات من تسجيلاته الخاصة لتوليد أصوات جديدة مستمدة منها.
وتوصي الشركة المستخدمين الذين يحتاجون إلى قدرات أكبر لإنتاج الأصوات باستخدام خدمتها المميزة “Stable Audio”.
ومن المهم الإشارة إلى أن نموذج “Stable Audio Open” لا يمكن استخدامه لأغراض تجارية وفقًا لشروط الخدمة الخاصة به، كما أنه لا يعمل بكفاءة عالية مع المطالبات النصية المكتوبة بلغات غير الإنجليزية أو عند توليد مقاطع صوتية غير متوافقة مع بيانات التدريب.
وقد واجهت شركة Stability AI تحديات في الفترة الأخيرة في تطوير منتجاتها، خاصة بعد استقالة نائب رئيس الصوت التوليدي، إد نيوتن ريكس، الذي زعم أن الشركة تدرب نماذج الذكاء الاصطناعي التوليدي على الأعمال المحمية بحقوق الطبع والنشر.
تسعى الشركة من خلال إطلاق هذا النموذج الجديد إلى الدفاع عن نفسها ضد الاتهامات الموجهة إليها، وترويج خدماتها المتقدمة لإنتاج الأصوات بالذكاء الاصطناعي. ويذكر أن شركة سوني كانت قد أرسلت في مايو الماضي خطابًا إلى مئات الشركات العاملة في مجال الذكاء الاصطناعي التوليدي، محذرة إياها من “الاستخدام غير المصرح به” لمحتواها لتدريب مولّدات الصوت.
تكنو تُدخل عالم الذكاء الاصطناعي بمساعدها الجديد Ella-GPT