إنفيديا تكشف عن نموذج ذكاء اصطناعي متطور لإنتاج الصوت

نوفمبر 26, 2024

كشفت شركة إنفيديا عن نموذج ذكاء اصطناعي تجريبي جديد يُدعى “Foundational Generative Audio Transformer Opus 1″، المعروف اختصارًا باسم “Fugatto”. يتميز هذا النموذج بتركيزه الأساسي على معالجة الصوت، حيث يتيح إنشاء أصوات أو تعديل الموسيقى والملفات الصوتية استنادًا إلى الأوامر النصية.

تم تطوير Fugatto بواسطة فريق دولي من الباحثين المتخصصين في الذكاء الاصطناعي، مما ساهم في تنوع قدراته لدعم لهجات ولغات متعددة. وأوضح رافاييل فالي، مدير أبحاث الصوت التطبيقية في إنفيديا وأحد مطوري المشروع، أن الهدف الرئيسي كان إنشاء نموذج يمكنه فهم الصوت وإنتاجه بطريقة مشابهة للبشر.

استخدامات النموذج

أشارت إنفيديا في بيانها إلى العديد من التطبيقات العملية التي يمكن للنموذج تقديمها، أبرزها:

إنتاج الموسيقى والأفكار الصوتية: يساعد المنتجين في إنشاء نماذج أولية بسرعة، مع إمكانية تعديل الأنماط، الأصوات، والآلات الموسيقية بسهولة.

التعليم الصوتي: تصميم أدوات تعليمية مخصصة لتعلم اللغات باستخدام أصوات مخصصة.

ألعاب الفيديو: توفير نسخ متعددة للأصول الصوتية المسجلة مسبقًا، بما يتماشى مع تغييرات اللعبة الناتجة عن قرارات اللاعبين.

قدرات إضافية

أكد الباحثون أن Fugatto قادر على أداء مهام غير مدرجة ضمن تدريبه الأولي بعد إجراء تعديلات طفيفة، مثل:

توليد نبرة صوت غاضبة بلكنة معينة.

إنشاء أصوات طبيعية، مثل تغريد العصافير وسط عاصفة.

إنتاج أصوات ديناميكية تتغير مع الزمن، مثل صوت قطار يتحرك عبر مناطق مختلفة.

المنافسة والتوافر

حتى الآن، لم تعلن إنفيديا عن إتاحة النموذج للاستخدام العام. يُذكر أن Fugatto يواجه منافسة من نماذج مشابهة أطلقتها شركات أخرى، مثل أدوات الذكاء الاصطناعي مفتوحة المصدر من ميتا لإنشاء الأصوات من النصوص، ونموذج MusicLM من جوجل لتحويل النص إلى موسيقى.

التعليق بواسطة حساب الفيسبوك

https://wp.me/pejB6W-pDS