الكشف عن برنامج جديد ينسخ أي صوت بعد الاستماع إليه بـ3 ثوان فقط
مايكروسوفت اعتمدت على نحو 600 ألف ساعة من البيانات الصوتية للتأكد من جاهزية البرنامج
كشفت شركة مايكروسوفت الأمريكية عن “فال إي” وهي تكنولوجيا تعتمد على الذكاء الاصطناعي، وقادرة على نسخ صوت أي شخص بناء على ثلاث ثواني فقط من تسجيلاته الصوتية.
وخلال العمل على إنتاج البرنامج، اعتمدت مايكروسوفت على نحو 600 ألف ساعة من البيانات الصوتية باللغة الإنجليزية، بحسب ما يذكره الموقع الأمريكي المتخصص بالتكنولوجيا “آرس تكنيكا”. وقد يكون نسخ صوت الأشخاص مع نغماتهم وعاطفتهم الصوتية أبرز ميزات “فال-إي”.
ويعد مصمّمو البرنامج بأنه سيكون “وفياً لأبعد الحدود” لناحية تقليد صوت الشخص، فيما نشرت الشركة الأمريكية نسخاً من التجارب التي أنجزتها على موقع خاص بالبرنامج.
وتقول الشركة إن البرنامج بحاجة على الأقل إلى ثلاث ثواني من صوت شخص كي يتمكن من تقليده، وإنه كلما طال التسجيل الصوتي، كلّما تحسنت نوعية المادة المقلدة التي يتم إنتاجها.
وكبرامج أخرى من الذكاء الاصطناعي، تطرح هذه التكنولوجيا الجديدة مسألة التزوير، حيث يتخوف البعض من استخدامها لغايات مشبوهة. في العالم المرئي، استخدمت تكنولوجيا “Deep Fake” لتركيب فيديوهات تخص بعض المشاهير.
ويمكن بفضل التكنولوجيا المتقدمة التي يؤمنها “فال-إي” استهداف سياسيين أو مشاهير أيضاً، ما قد يطرح مشاكل أمنية. ففي بعض دول العالم الغربي، تعتمد المصارف على سبيل المثال على صوت وكلائها عبر الهاتف من أجل الحصول على كلمات سرّ معينة.
ولكن البرنامج يطرح مشكلة أخرى تتعلق بقطاع العمل والوظائف، إذ بإمكانه تقليد صوت أي ممثل من أجل الدوبلاج مثلاً في الأفلام والمسلسلات، أو حتى في إنتاج الكتب المسموعة وقصص الأطفال إلخ.
ووعدت مايكروسوفت بأنها ستطور أداة أخرى من أجل تنظيم استخدام “فال-إي” بحيث يصبح من الصعب جداً انتهاك حقوق الآخرين من خلاله، ولذا، فهي لم تطرحه حتى الآن في الأسواق.