دراسة حديثة تثير الشكوك حول كفاءة تقنية DeepSeek في معالجة النصوص الطويلة

دراسة حديثة تثير الشكوك حول كفاءة تقنية DeepSeek في معالجة النصوص الطويلة


أثارت تقنية جديدة طورتها شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي جدلًا علميًا كبيرًا، بعد أن أظهرت دراسة بحثية جديدة ترددًا في قدرتها المعلنة على تحسين معالجة نماذج الذكاء الاصطناعي للنصوص الطويلة، في واحدة من الحالات القليلة التي تواجه فيها أبحاث الشركة انتقادات علنية.


الدراسة، التي إعدادها باحثون من جامعة توهوكو اليابانية والأكاديمية الصينية للعلوم، تناولت تقنية DeepSeek-OCR، وهي أسلوب يعتمد على تمثيل النصوص بصريًا بهدف ضغطها، ما يُفترض أن يسهل على نماذج الذكاء الاصطناعي تجاوز مشكلة «عنق زجاجة السياق الطويل».


ما هي تقنية DeepSeek-OCR؟


كشفت DeepSeek عن هذه التقنية في أكتوبر الماضي، ووصفتها بأنها قادرة على إحداث نقلة نوعية في معالجة المستندات الكبيرة والمعقدة، من خلال استخدام الإدراك البصري كوسيلة ضغط للنصوص، ووفقًا للشركة، يمكن لهذه الطريقة تقليل عدد الرموز النصية (Tokens) بمعدل يتراوح بين 7 و20 مرة.


 


نتائج مقلقة من اختبارات مستقلة


لكن الدراسة الجديدة، التي تحمل عنوان «قيمة بصرية أم عكاز لغوي؟ نظرة متعمقة على DeepSeek-OCR»، خلصت إلى أن أداء التقنية كان غير متسق، وأنها تعتمد بشكل كبير على ما يُعرف بـ«الأسبقيات اللغوية»، أي الأنماط التي تعلمتها النماذج من كميات هائلة من النصوص، بدلًا من الفهم البصري الحقيقي الذي زعمت التقنية أنها تقدم.


ووصف الباحثون مؤشرات الأداء التي أعلنتها DeepSeek بأنها «مضللة»، مشيرين إلى أن دقة الإجابة عن الأسئلة البصرية انخفضت إلى نحو 20% عند إضافة نص إضافي يؤثر على الاستدلال، مقارنةً بأكثر من 90% لدى نماذج الذكاء الاصطناعي التقليدية.


 


أزمة السياق الطويل ما زالت قائمة


أوضح الباحثون أن نماذج الذكاء الاصطناعي لا تزال تواجه قيودًا أساسية في معالجة المستندات الطويلة أو الحوارات الممتدة، وهي مشكلة تسعى شركات ومراكز أبحاث في جميع أنحاء العالم إلى حلها، ولكن نتائج الدراسة تثير تساؤلات جوهرية حول ما إذا كانت تقنيات الضغط البصري الحالية تمثل فعلاً مسارًا عمليًا لتجاوز هذه القيود.


 


آراء متباينة في الوسط العلمي


لم ترد شركة DeepSeek على طلب للتعليق على الفور، لكن بعض خبراء علوم الحاسوب اعتبروا أن التقنية لا تمثل فشلًا بقدر ما هي سلاح ذو حدين، حيث أشار لي بوجييه، الحاصل على دكتوراه في علوم الحاسوب من جامعة العلوم والتكنولوجيا الصينية، والذي يدير حاليًا شركة ناشئة في بكين، إلى أن الاعتماد على المعرفة المكتسبة قد يكون مفيدًا عند التعامل مع مخطوطات غير واضحة، ولكنه قد يتحول إلى نقطة ضعف عند قراءة نصوص مطبوعة بوضوح، وأضاف: «يمكن القول إن لهذه الطريقة مزاياها وعيوبها في الوقت نفسه».


 


مستقبل تقنيات قراءة النصوص الطويلة


تظهر هذه الدراسة أن السباق لتحسين قدرات الذكاء الاصطناعي في فهم النصوص الطويلة لا يزال مفتوحًا، ولا توجد حتى الآن «حلول سحرية» تناسب جميع الحالات، مما يدفع الباحثين إلى البحث عن استراتيجيات بديلة وأكثر موثوقية.