SEER من فيسبوك يعزز الرؤية الحاسوبية للذكاء الاصطناعي

مارس 8, 2021

SEER من فيسبوك يعزز الرؤية الحاسوبية للذكاء الاصطناعي أعلنت شركة فيسبوك أنها قامت ببناء برنامج ذكاء اصطناعي يسمى SEER يمكنه رؤية ما يبحث عنه، وفعلت ذلك من خلال تغذيته بأكثر من مليار صورة عامة من إنستاجرام.

وأصبحت منصة إنستاجرام واحدة من أكبر قواعد بيانات الصور على هذا الكوكب على مدار العقد الماضي، وتستخدم مالكة الشركة، فيسبوك، هذا الكنز الدفين لتعليم الآلات ما يوجد في الصورة.

وقالت فيسبوك: إن برنامج الرؤية الحاسوبية SEER تفوق في الأداء على نماذج الذكاء الاصطناعي الحالية في اختبار التعرف على الأشياء.

وحقق البرنامج نسبة 84.2 في المئة وفقًا لمعيار درجة دقة التصنيف عند إجراء اختبار مقدم من ImageNet، وهي قاعدة بيانات مرئية كبيرة مصممة للاستخدام في أبحاث برامج التعرف على الأشياء المرئية.

ويختبر هذا المعيار بشكل أساسي ما إذا كان برنامج الذكاء الاصطناعي يمكنه تحديد ما هو موجود في الصورة.

وفي حين يتم تدريب العديد من نماذج الذكاء الاصطناعي على مجموعات البيانات المصنفة، قالت فيسبوك: إن SEER تعلم كيفية التعرف على الكائنات في الصور من خلال تحليل صور إنستاجرام العشوائية وغير المصنفة وغير المشبعة.

وتُعرف تقنية الذكاء الاصطناعي هذه بالتعلم تحت الإشراف الذاتي، و كتب باحثو فيسبوك: يتمثل مستقبل الذكاء الاصطناعي في إنشاء أنظمة يمكنها التعلم مباشرة من أي معلومات يتم تقديمها دون الاعتماد على مجموعات البيانات المنسقة لتعليمهم كيفية التعرف على الكائنات في الصورة أو تفسير جزء من النص.

وأضافوا: يوضح أداء SEER أن التعلم تحت الإشراف الذاتي يمكن أن يتفوق في مهام الرؤية الحاسوبية في العالم الحقيقي، ويمهد هذا الإنجاز الطريق في المستقبل لنماذج الرؤية الحاسوبية الأكثر مرونة ودقة.

وفي حين أن هذا مجرد مشروع بحثي، قال متحدث باسم فيسبوك: إن الاستخدامات المحتملة واسعة نسبيًا.

وأوضحت الشركة أن الاستخدامات المحتملة تشمل النص المحسن المولد تلقائيًا لوصف الصور للأشخاص الذين يعانون من إعاقات بصرية، والتصنيف التلقائي الأفضل للعناصر المباعة عبر سوق فيسبوك، والأنظمة الأفضل لإبقاء الصور الضارة بعيدًا عن منصة فيسبوك.

وقالت (بريا جويال) Priya Goyal، مهندسة البرمجيات في مختبر فيسبوك لأبحاث الذكاء الاصطناعي: نبلغ أصحاب حسابات إنستاجرام عبر سياسة البيانات بأننا نستخدم المعلومات التي لدينا لدعم البحث والابتكار.

وأضافت جويال: بالرغم من أننا نشارك تفاصيل بحثنا ونبني مكتبة مفتوحة المصدر تسمح للباحثين الآخرين باستخدام التعلم الذاتي لتدريب النماذج على الصور، فإننا لا نشارك الصور أو وضع SEER.

وتحاول شركات التكنولوجيا الكبيرة الأخرى، بما في ذلك جوجل ومايكروسوفت أيضًا دفع حدود الرؤية الحاسوبية.

وفي الصيف الماضي، نشرت جوجل نموذج الرؤية الحاسوبية SimCLRv2، بينما نشرت شركة OpenAI نموذج iGPT 2.

التعليق بواسطة حساب الفيسبوك