منصة IGTV تحصل على التسميات التوضيحية التلقائية
منصة IGTV تحصل على التسميات التوضيحية التلقائية ، أعلنت شركة فيسبوك عن توفر التسميات التوضيحية التلقائية لمنصة (IGTV) بما يصل إلى 16 لغة على مستوى العالم عند الإطلاق.
فيسبوك تطلق ميزة المشاهدة الجماعية في مكالمات مسنجر المرئية
ويأتي هذا الإصدار بعد إطلاق ميزة التسميات التوضيحية التلقائية لميزة (Facebook Live) و (Workplace Live)، التي وصلت في شهر مارس بست لغات هي: الإنجليزية والإسبانية والبرتغالية والإيطالية والألمانية والفرنسية.
وتقول فيسبوك: إن ميزة التسميات التوضيحية الموسعة تعتمد على التحديثات النصية البديلة التي أجرتها قبل بضع سنوات لدعم الأشخاص ذوي الرؤية المحدودة.
وأضافت: “كلما زاد عدد الأشخاص الذين يستخدمون التسميات التوضيحية، فإن الذكاء الاصطناعي يتعلم، ونتوقع أن تستمر الجودة في التحسن، وهذه خطوة صغيرة، ونتطلع إلى التوسع في المزيد من الأماكن واللغات والبلدان”.
وأوضحت منصة التواصل الاجتماعي في تدوينة أنها طورت تقنية لتدريب نماذج التعلم الآلي التي تدعم التعرف التلقائي على الكلام للتنبؤ مباشرة بأشكال الأحرف للكلمات، مما يبسط تدريب النموذج.
ودرب المهندسون النماذج على التكيف مع كلمات جديدة، والتنبؤ بمكان حدوثها في مقاطع الفيديو باستخدام منشورات فيسبوك العامة.
وتقول فيسبوك أيضًا: إنها كانت قادرة على نشر هذه النماذج مع عدد من تحسينات البنية التحتية، مما مكنها من خدمة حركة مرور الفيديو الإضافية الناتجة عن الأحمال المرتبطة بالوباء.
ووفقًا للمنصة، فقد تضاعف عدد عمليات البث المباشر عبر فيسبوك من الصفحات في شهر يونيو 2020 مقارنةً بالوقت نفسه من العام الماضي.
وأطلقت فيسبوك أول منتج للتسميات التوضيحية التلقائية في شهر فبراير 2016 لإعلانات الفيديو، وأطلقت في أكتوبر من العام نفسه أداة مجانية لتسميات الفيديو عبر جميع صفحات فيسبوك باللغة الإنجليزية.
وبالرغم من أن الأدوات قد تحسنت على مر السنين، إلا أن الأدلة تشير إلى أن أمامها طريق طويل.
وكما لاحظت مجلة فوربس في مقال حديث، فإن أخطاء التسميات التوضيحية تؤثر بشكل غير متناسب في تجربة مشاهدة الفيديو لمن يعانون من ضعف السمع.
وبالنظر إلى إدراكها الواضح لأوجه القصور في أنظمتها، تقول فيسبوك: إنها تبحث عن طرق لتحسين التسميات التوضيحية في المستقبل.
وتمكنت فيسبوك في دراسة أجريت الشهر الماضي من تقليل معدل أخطاء الكلمات – وهو مقياس شائع لأداء التعرف على الكلام – بأكثر من 20 في المئة باستخدام طريقة جديدة.