باحثون من آبل قدموا نموذجا جديدا مفتوح المصدر للذكاء الاصطناعي، يتيح للمستخدمين تعديل الصور بسهولة عبر تعليمات باللغة الطبيعية دون الحاجة لبرامج تحرير الصور التقليدية.
هذا النموذج، المسمى MGIE، يمكنه قص الصور، تغيير حجمها، قلبها، وإضافة مرشحات إليها استنادا إلى التوجيهات النصية التي يتلقاها.
يستفيد MGIE من النماذج اللغوية المتعددة الوسائط لتفسير تعليمات المستخدم وتنفيذ العمليات على مستوى البكسل.
آبل تعاونت مع جامعة كاليفورنيا سانتا باربرا لتطوير MGIE، الذي يمكنه أداء مهام تحرير الصور البسيطة والمعقدة، مثل تعديل الكائنات في الصور لتغيير شكلها أو زيادة سطوعها.
يجمع النموذج بين استخدام متعدد للنماذج اللغوية المتعددة الوسائط، حيث يتعلم كيفية فهم طلبات المستخدم وتصوّر التعديل المطلوب.
المستخدم يحتاج إلى كتابة ما يرغب في تغييره في الصورة عند استخدام MGIE.
الأبحاث توضح فعالية MGIE في تحسين التقييمات التلقائية والبشرية، مع الحفاظ على الكفاءة التنافسية.
يقول باحثو آبل: “يمتلك MGIE فهمًا واضحًا للنية البصرية بدلا من التوجيهات الغامضة، مما يؤدي إلى تحرير الصور بشكل منطقي”.
تجري آبل دراسات شاملة لتحسين أداء MGIE والحفاظ على الكفاءة.
تمكن المستخدمين من تنزيل MGIE عبر GitHub واستعراض التعليمات البرمجية والبيانات.
آبل توفر عروضًا تجريبية لاستخدام MGIE، بالإضافة إلى إمكانية تجربته عبر Hugging Face Spaces.
تمتلك شركات أخرى مثل OpenAI و Adobe نماذج لتحرير الصور بالذكاء الاصطناعي.
آبل تهدف إلى إضافة المزيد من الميزات ذات الذكاء الاصطناعي إلى منتجاتها.
إيلون ماسك يسعى لجمع 6 مليارات دولار لتطوير الذكاء الاصطناعي