تقنية DeepSeek-OCR تحت المجهر: دراسة تشكك في وعود تحسين فهم النصوص الطويلة
أثارت تقنية طورتها شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي جدلًا علميًا واسعًا، بعد أن شككت دراسة بحثية حديثة في قدرتها المعلنة على تعزيز تعامل نماذج الذكاء الاصطناعي مع النصوص الطويلة، في واحدة من الحالات النادرة التي تتعرض فيها أبحاث الشركة لانتقاد أكاديمي علني.
الدراسة، التي أعدها باحثون من جامعة توهوكو اليابانية والأكاديمية الصينية للعلوم، تناولت تقنية DeepSeek-OCR التي تعتمد على تمثيل النصوص بصريًا بهدف ضغطها، وهي مقاربة يُفترض أن تساعد النماذج على تجاوز ما يُعرف بـ«عنق زجاجة السياق الطويل».
وكانت DeepSeek قد كشفت عن هذه التقنية في أكتوبر الماضي، ووصفتها بأنها قادرة على إحداث نقلة نوعية في معالجة المستندات الكبيرة والمعقدة، عبر استخدام الإدراك البصري كوسيط لضغط النصوص، مشيرةً إلى إمكانية تقليل عدد الرموز النصية (Tokens) بمعدل يتراوح بين 7 و20 مرة.
غير أن نتائج الاختبارات المستقلة جاءت مغايرة للتوقعات؛ إذ خلصت الدراسة، المعنونة بـ«قيمة بصرية أم عكاز لغوي؟ نظرة متعمقة على DeepSeek-OCR»، إلى أن أداء التقنية اتسم بعدم الاتساق، وأنها تعتمد بدرجة كبيرة على «الأسبقيات اللغوية» المكتسبة من التدريب على كميات ضخمة من النصوص، بدلًا من الفهم البصري الحقيقي الذي ادعت التقنية تقديمه.
ووصف الباحثون مؤشرات الأداء التي أعلنتها DeepSeek بأنها «مضللة»، موضحين أن دقة الإجابة عن الأسئلة البصرية تراجعت إلى نحو 20% عند إضافة نصوص إضافية تؤثر في الاستدلال، مقارنةً بدقة تجاوزت 90% لدى نماذج ذكاء اصطناعي تقليدية في ظروف مماثلة.
كما أشارت الدراسة إلى أن أزمة التعامل مع السياق الطويل لا تزال قائمة، وأن نماذج الذكاء الاصطناعي تعاني من قيود جوهرية عند معالجة المستندات المطولة أو الحوارات الممتدة. ورغم الجهود المتواصلة من شركات ومراكز أبحاث حول العالم، تثير هذه النتائج تساؤلات حول مدى جدوى تقنيات الضغط البصري الحالية كحل عملي لهذه المشكلة.
وفي ظل غياب رد فوري من شركة DeepSeek، تباينت آراء المختصين؛ إذ رأى بعض خبراء علوم الحاسوب أن التقنية لا تمثل فشلًا بقدر ما تُعد «سلاحًا ذا حدين». وقال لي بوجييه، الحاصل على دكتوراه في علوم الحاسوب من جامعة العلوم والتكنولوجيا الصينية والمدير الحالي لشركة ناشئة في بكين، إن الاعتماد على المعرفة المكتسبة قد يكون مفيدًا عند التعامل مع مخطوطات غير واضحة، لكنه قد يتحول إلى نقطة ضعف عند قراءة نصوص مطبوعة بوضوح، مضيفًا أن «للتقنية مزايا وعيوبًا في آن واحد».
وتخلص الدراسة إلى أن السباق نحو تحسين فهم الذكاء الاصطناعي للنصوص الطويلة لا يزال مفتوحًا، وأنه لا توجد حتى الآن حلول شاملة تلبي جميع الاستخدامات، ما يدفع الباحثين إلى مواصلة البحث عن استراتيجيات أكثر موثوقية وفاعلية
ثغرات أمنية خطيرة في تطبيق “DeepSeek” على iOS تعرض بيانات المستخدمين للخطر







