
أعلنت جوجل عن إطلاق أحدث نماذجها للذكاء الاصطناعي المخصص لتحرير الصور، والذي كان يُعرف بالاسم الرمزي “نانو بانانا” قبل دمجه رسميًا في تطبيق Gemini تحت اسم “Gemini 2.5 Flash Image”. وقد أثار النموذج اهتمامًا واسعًا في الأوساط التقنية قبل طرحه، لما يقدمه من قدرات متقدمة في إنشاء صور دقيقة ومطابقة للسياق، مع الحفاظ على اتساق العناصر الأصلية.
وأكد الرئيس التنفيذي لجوجل، سوندار بيتشاي، هذا الإطلاق من خلال تغريدة على منصة X، استعرض فيها صورًا معدلة لكلبه “جيفري” باستخدام الأداة الجديدة. وأظهرت الصور قدرة النموذج على إدخال تغييرات متنوعة على الشخصية نفسها، مثل وضعها في مشهد ركوب الأمواج، أو إلباسها قبعة رعاة البقر، أو حتى تحويلها إلى بطل خارق، مع الحفاظ على ملامحها المميزة.
ويعتمد النموذج على تقنيات متطورة تعالج واحدة من أبرز التحديات في أدوات الذكاء الاصطناعي لتوليد الصور، وهي فقدان التناسق بين الصورة الأصلية والصورة المعدلة. إذ يكفي للمستخدم تحميل صورة وتقديم وصف نصي ليُجري الذكاء الاصطناعي التعديلات المطلوبة مع الاحتفاظ بالهوية البصرية للموضوع. كما يدعم النموذج ميزات متقدمة، مثل التحرير متعدد المراحل ومزج التصاميم، مما يتيح إنتاج مشاهد معقدة وتطبيق أنماط وقوام من صورة إلى أخرى.
ويتوفر Gemini 2.5 Flash Image عالميًا ابتداءً من اليوم، سواء للمستخدمين المجانيين أو المشتركين المدفوعين في تطبيق Gemini. ولضمان الشفافية، ستتضمن جميع الصور المولدة علامات مائية مرئية وأخرى رقمية SynthID من جوجل للدلالة على أنها صُنعت بالذكاء الاصطناعي. كما أصبح النموذج متاحًا للمطورين والشركات عبر واجهة برمجة تطبيقات Gemini.
أنثروبيك تطلق وكيل الذكاء الاصطناعي Claude for Chrome بنسخته التجريبية مع ميزات أمان متقدمة