بعد نحو عامين من تصريحات الرئيس التنفيذي لمايكروسوفت، ساتيا ناديلا، التي توقع فيها هيمنة الذكاء الاصطناعي التوليدي على ما يُعرف بـ«أعمال المعرفة»، يكشف الواقع داخل مكاتب المحاماة والبنوك الاستثمارية صورة مختلفة تماماً، حيث ما يزال الإنسان هو العنصر المحوري في أداء هذه المهام.
وتوضح دراسة حديثة السبب الحقيقي وراء تعثر موجة الاستبدال المنتظرة، إذ تشير إلى أن الذكاء الاصطناعي يعاني من ضعف واضح عند التعامل مع تعقيدات العمل الواقعي وفوضاه اليومية.
اختبار صعب لفكرة الاستبدال
أعلنت شركة «ميركور» المتخصصة في بيانات تدريب الذكاء الاصطناعي عن معيار جديد يحمل اسم APEX-Agents، وهو اختبار يبتعد كلياً عن المهام الاستعراضية المعتادة مثل كتابة الشعر أو حل المسائل الرياضية، وفق تقرير نشره موقع Digital Trends واطلعت عليه العربية Business.
ويرتكز هذا الاختبار على سيناريوهات عملية مأخوذة من بيئة العمل الحقيقية لمحامين ومستشارين وبنكيين، حيث طُلب من النماذج تنفيذ مهام معقدة تتكون من عدة مراحل، وتتطلب التعامل مع مصادر متنوعة وأنواع مختلفة من البيانات.
وجاءت النتائج مخيبة للتوقعات؛ إذ فشلت أقوى نماذج الذكاء الاصطناعي الحالية، مثل Gemini 3 Flash وGPT-5.2، في تجاوز نسبة دقة 25%.
وتصدر نموذج «جيميني» النتائج بدقة بلغت 24%، تلاه GPT-5.2 بنسبة 23%، بينما حققت بقية النماذج نسباً أقل بكثير.
مكمن الخلل لدى الذكاء الاصطناعي
يوضح الرئيس التنفيذي لشركة ميركور، بريندان فودي، أن المشكلة لا تكمن في القدرات الحسابية للنماذج، بل في ضعف فهمها للسياق العام.
ففي بيئات العمل الحقيقية، نادراً ما تكون الإجابات مباشرة أو جاهزة، إذ تتطلب جمع معلومات متفرقة من مصادر متعددة وربطها ببعضها البعض.
فعلى سبيل المثال، قد يحتاج المحامي إلى مراجعة محادثات عبر «سلاك»، والاطلاع على سياسة داخل ملف PDF، وتحليل جدول بيانات، ثم دمج هذه العناصر للإجابة عن استفسار يتعلق بالامتثال لتشريعات مثل اللائحة العامة لحماية البيانات (GDPR).
هذه القدرة على التنقل بين السياقات المختلفة والتعامل معها بمرونة تُعد مهارة بشرية بامتياز، في حين يواجه الذكاء الاصطناعي صعوبة كبيرة عند البحث بين مصادر متفرقة، ما يؤدي إلى أخطاء أو فقدان المسار أو التوقف عن إتمام المهمة.
متدرب ذكي… لكنه غير موثوق
وتمنح نتائج الدراسة قدراً من الطمأنينة، ولو مؤقتاً، لمن يخشون فقدان وظائفهم، إذ تشبه الذكاء الاصطناعي حالياً بـ«متدرب غير موثوق»، ينجح في إنجاز المهمة مرة واحدة فقط من كل أربع محاولات.
لكن في المقابل، تحذر شركة «ميركور» من سرعة التطور اللافتة، حيث لم تتجاوز دقة هذه النماذج قبل عام واحد فقط نسبة 5% إلى 10%، بينما اقتربت اليوم من 24%، وهو ما يعكس تسارعاً واضحاً في وتيرة التعلم والتحسن.
ثورة مؤجلة لا ملغاة
في الوقت الراهن، لا يبدو أن الذكاء الاصطناعي جاهز لتولي المهام المكتبية المعقدة أو إزاحة أصحاب أعمال المعرفة عن مواقعهم.
غير أن الخلاصة الأهم التي تخرج بها الدراسة هي أن السؤال لم يعد «هل سيصل الذكاء الاصطناعي إلى هذه المرحلة؟»، بل «متى سيصل؟».
وإلى أن تنجح النماذج في إتقان تعدد المهام وفهم السياقات المعقدة بعمق، ستظل ثورة الذكاء الاصطناعي في بيئات العمل مؤجلة… لكنها ليست مستبعدة.

