جوجل تطلق أداة Whisk لتوليد الصور باستخدام الذكاء الاصطناعي عبر الصور بدلاً من النصوص

ديسمبر 17, 2024

دقيقة واحدة

جوجل تطلق أداة Whisk لتوليد الصور باستخدام الذكاء الاصطناعي عبر الصور بدلاً من النصوص

كشفت شركة جوجل عن أداة جديدة لتوليد الصور تُسمى “Whisk”، والتي تم تطويرها ضمن مجموعة أدواتها التجريبية. تتيح هذه الأداة للمستخدمين إمكانية إدخال صور بدلاً من النصوص التفصيلية للحصول على صور معدلة أو “مُعاد تخيلها”.

وتتيح أداة Whisk للمستخدمين إدخال صور متعددة لتحديد عناصر مختلفة مثل الموضوع، النمط، والمشهد. وتعتمد الأداة على نماذج الذكاء الاصطناعي من فئة “جمني” لإنشاء نصوص وصفية يمكن استخدامها كمدخلات لنموذج جوجل لتوليد الصور “Imagen 3”.

يُعتبر نموذج “Imagen 3″، الذي أطلقته جوجل في وقت سابق من هذا العام، من أفضل النماذج في مجال توليد الصور، حيث يتميز بقدرته على إنتاج صور دقيقة التفاصيل، مع إضاءة غنية وتقليل التشوهات مقارنةً بالإصدارات السابقة.

وأوضحت جوجل في منشور عبر مدونتها الرسمية أن أداة Whisk لا تهدف إلى إعادة إنشاء النسخة الأصلية من الصور، بل تركز على التقاط “جوهر” الموضوع فقط. كما أشارت إلى أن الأداة قد تُنتج صورًا قد تختلف عن التوقعات، حيث قد تظهر بعض العناصر، مثل الأشخاص، بتفاصيل مختلفة مثل لون البشرة أو تصفيفة الشعر.

من خلال أداة Whisk، يمكن للمستخدمين تعديل النصوص الخلفية لتعويض العناصر المفقودة أو تحسين النتائج. وقالت جوجل: “ندرك أن بعض العناصر قد تكون أساسية لمشروعك وقد لا تنجح Whisk في تحقيقها بدقة، لذا نسمح لك بعرض النصوص الخلفية وتعديلها في أي وقت”.

ورغم أن الأداة لا تشبه برامج تعديل الصور التقليدية، فإنها تُعد وسيلة إبداعية لاستكشاف أفكار جديدة والتفاعل مع عملية إنشاء الصور بسرعة وبطريقة مبتكرة. كما توفر الأداة خيار تنزيل الصور الناتجة.

حالياً، أداة Whisk متاحة بنسخة تجريبية للمقيمين في الولايات المتحدة المسجلين في منصة “Google Labs”، التي تمنحهم إمكانية الوصول إلى المزايا التجريبية لجوجل في مجال الذكاء الاصطناعي.

إنفيديا تكشف عن نموذج ذكاء اصطناعي متطور لإنتاج الصوت

التعليق بواسطة حساب الفيسبوك