خوارزمية جديدة لتسمية الصور تتجاوز الدقة البشرية
خوارزمية جديدة لتسمية الصور تتجاوز الدقة البشرية ، طورت شركة مايكروسوفت خوارزمية جديدة لتسمية الصور تتجاوز الدقة البشرية في بعض الاختبارات المحدودة.
وتم استخدام نظام الذكاء الاصطناعي لتحديث تطبيق الشركة المساعد للمكفوفين المسمى (Seeing AI).
ومن المفترض دمج نظام الذكاء الاصطناعي قريبًا في منتجات مايكروسوفت الأخرى، مثل (Word) و (Outlook) و (PowerPoint).
ويجري استخدام نظام الذكاء الاصطناعي ضمن منتجات مايكروسوفت الأخرى لأداء مهام، مثل إيجاد نص بديل للصور، وهي وظيفة ذات أهمية خاصة لزيادة إمكانية الوصول.
وقالت مايكروسوفت: يمكن للجميع تضمين نص بديل للصور في المستندات وعبر الويب وفي منصات التواصل الاجتماعي، ويتيح ذلك للأشخاص المكفوفين الوصول إلى المحتوى والمشاركة في المحادثة، لكن الناس لا يفعلون ذلك.
وهناك العديد من التطبيقات التي تستخدم التسمية التوضيحية للصور كطريقة لملء النص البديل عندما يكون مفقودًا، ومن ضمنها برنامج (Seeing AI) الصادر في عام 2017.
ويستخدم التطبيق الرؤية الحاسوبية لوصف العالم للمكفوفين من خلال كاميرا الهاتف الذكي، ويمكنه التعرف على الأدوات المنزلية وقراءة النصوص ومسحها ضوئيًا ووصف المشاهد وحتى التعرف على الأصدقاء.
ويمكن استخدامه أيضًا لوصف الصور في تطبيقات أخرى، ومن ضمنها البريد الإلكتروني وتطبيقات التواصل الاجتماعي وتطبيقات المراسلة، مثل واتساب.
وتعمل خوارزمية التسمية التوضيحية للصور الجديدة من مايكروسوفت على تحسين أداء (Seeing AI) بشكل كبير، حيث إنها قادرة على تحديد الكائنات ووصف العلاقة بينها بشكل أكثر دقة.
ويمكن للخوارزمية النظر إلى صورة وتحديد العناصر والأشياء الموجودة وكيف يتفاعلون، وتقول مايكروسوفت: إن الخوارزمية أفضل مرتين من نظامها السابق لتسمية الصور المستخدم منذ عام 2015.
وحققت الخوارزمية أعلى الدرجات على الإطلاق في معيار التسمية التوضيحية للصور المعروف باسم (nocaps).
وشهدت مهمة تسمية الصور تحسينات هائلة في السنوات الأخيرة بفضل الذكاء الاصطناعي، ومن المؤكد أن خوارزميات مايكروسوفت هي أحدث ما توصلت إليه التكنولوجيا.
تطبيق جوجل Live Transcribe يصبح أكثر ذكاءً ويدعم الآن الساعات الذكية