مايكروسوفت تُطلق تقنية تُحوّل الصور إلى فيديوهات واقعية
أحرزت شركة مايكروسوفت تقدماً ملحوظاً في مجال إنتاج المحتوى باستخدام الذكاء الاصطناعي، بعد إعلانها عن نموذج جديد للذكاء الاصطناعي يستطيع إنتاج مقاطع فيديو واقعية لوجوه بشرية تتحرك وتتحدث بطريقة طبيعية.
يعتمد هذا النموذج، المسمى VASA-1، على تحويل الصورة إلى الفيديو باستخدام الذكاء الاصطناعي، حيث يستطيع إنشاء مقاطع فيديو من صورة واحدة مع تزويدها بتسجيل صوتي للكلام.
تقدم الشركة معلومات عن كيفية عمل هذا النموذج وتسلط الضوء على قدراته، مؤكدة أنه قادر على إنتاج مقاطع فيديو بجودة عالية تصل إلى دقة 512×512 بكسل بمعدل يصل إلى 40 إطاراً في الثانية.
ويتيح النموذج إنتاج مقاطع فيديو عبر الإنترنت بسرعة ويوفر القدرة على تحكم دقيق في جوانب مختلفة من الفيديو، مثل حركة العين والرأس.
ومن الملفت للنظر أن النموذج يستطيع أيضاً إنشاء مقاطع فيديو باستخدام صور فنية وصوت غير إنجليزي، مما يظهر مدى تطور قدراته.
باحثو مايكروسوفت يشيرون إلى أن هذه القدرات لم تكن موجودة في البيانات التي تم تدريب النموذج عليها، مما يعكس قدرته على التعلم الذاتي.
مع ذلك، تؤكد الشركة أنها لا تعتزم إطلاق هذا النموذج للاستخدام العام، وتركز بدلاً من ذلك على استخدامه في إنشاء شخصيات افتراضية تفاعلية.
وفيما يتعلق بالمخاطر المحتملة، تشير الشركة إلى ضرورة التفكير في الاستخدامات الإيجابية لتقنيتها، مثل دعم التعليم وتوفير الدعم للأشخاص ذوي التحديات الاتصالية.
بهذا، تؤكد مايكروسوفت التزامها بتطوير الذكاء الاصطناعي بشكل مسؤول بهدف تعزيز رفاهية البشرية.
مايكروسوفت تُضخ 1.5 مليار دولار في G42 لتعزيز قدرات الذكاء الاصطناعي في الإمارات العربية المتحدة