جوجل تطلق نموذج Veo لتوليد الفيديو بالذكاء الاصطناعي وتحسين Imagen 3

ديسمبر 5, 2024

دقيقة واحدة

جوجل تطلق نموذج Veo لتوليد الفيديو بالذكاء الاصطناعي وتحسين Imagen 3

أعلنت شركة جوجل عن إطلاق نموذج Veo الجديد لتوليد الفيديو باستخدام الذكاء الاصطناعي، وذلك ضمن منصة Vertex AI المخصصة للشركات. يتيح هذا النموذج إنشاء مقاطع فيديو عالية الجودة بدقة تصل إلى 1080 بكسل، مع إمكانية استخدام أوامر نصية أو صور لإنتاج أنماط بصرية وسينمائية متنوعة. يأتي هذا الإعلان بعد أن قدمت جوجل النموذج لأول مرة في مايو الماضي، ليكون بمثابة منافس قوي لنموذج Sora من شركة OpenAI، والذي لا يزال قيد التطوير.

ويتميز Veo بقدرة كبيرة على إنتاج مقاطع فيديو لا تتجاوز مدتها دقيقة واحدة في النسخة التجريبية، مع تفاصيل دقيقة يصعب تمييزها عن الفيديوهات الحقيقية. على سبيل المثال، أظهرت جوجل مقطعًا يظهر كلبًا بحركات دقيقة تُظهر تفاصيل الفرو والياقة بطريقة واقعية، مما يعكس قوة النموذج في إنتاج مقاطع عالية الجودة.

إلى جانب ذلك، طرحت جوجل الإصدار الجديد من Imagen 3، الذي يعزز قدرة توليد الصور من النصوص عبر منصة Google Cloud. سيتاح هذا الإصدار ابتداءً من الأسبوع المقبل، مع مزايا إضافية مثل القدرة على تحرير الصور بناءً على أوامر نصية وإضافة الشعارات والعناصر الخاصة بالمستخدم.

رغم هذه الإنجازات، يظل نموذج Veo يحتوي على بعض العيوب، مثل مشاكل في الإضاءة التي قد تظهر في بعض المقاطع، كما حدث في إحدى التجارب عندما اخترق الضوء يد أحد الأشخاص بشكل غير طبيعي. ولكن جوجل أكدت أن كلا النموذجين يحتويان على آليات حماية فعالة لتجنب توليد محتوى ضار أو انتهاك حقوق الملكية الفكرية. كما تم دمج تقنية SynthID من DeepMind لتوفير علامة مائية غير مرئية لجميع المحتويات المنتجة، مما يساعد على الحد من التضليل الإعلامي.

مع هذه التحسينات، تجد OpenAI نفسها متأخرة في سباق الذكاء الاصطناعي التوليدي، خاصة مع تقدم جوجل الكبير في هذا المجال. وأظهرت بيانات جوجل أن 86% من المؤسسات التي اعتمدت على الذكاء الاصطناعي التوليدي قد شهدت زيادة في الإيرادات، مما يضع الشركات أمام حافز كبير لتبني تقنيات جوجل بسرعة دون انتظار منافسيها.

التعليق بواسطة حساب الفيسبوك