تجربة “Project Vend” تكشف حدود الذكاء الاصطناعي في الإدارة الاقتصادية: فشل نموذج Claude في تشغيل كُشك بيع

في تجربة عملية جريئة لاختبار قدرة نماذج الذكاء الاصطناعي على إدارة نشاط اقتصادي حقيقي، كشفت صحيفة وول ستريت جورنال، بالتعاون مع شركة أنثروبيك، عن إخفاق واضح لنموذج الذكاء الاصطناعي “Claude” في تشغيل كُشك بيع داخل مقر الصحيفة، ما دفع القائمين على المشروع إلى إيقافه بعد ثلاثة أسابيع فقط.

شبكة تك عربي

التجربة، التي حملت اسم Project Vend، صمّمها فريق اختبار الضغط في أنثروبيك المعروف بـ”الفريق الأحمر”، وشهدت مشاركة وكيلين ذكيين: الأول “Claudius Sennet” لتولي إدارة كُشك البيع، والثاني “Seymour Cash” في دور الرئيس التنفيذي للمشروع.

ووفق الإطار الموضوع للتجربة، كان على “Claudius” تحقيق أرباح عبر تزويد الكُشك بمنتجات رائجة من موردين بالجملة، والاستجابة لطلبات موظفي الصحيفة عبر منصة “Slack”، إلى جانب تسعير المنتجات، وإدارة المخزون، وضبط عمليات الشراء. وبعد مرحلة إشراف بشري أولية، مُنح النموذج حرية الشراء الذاتية بحد أقصى قدره 80 دولارًا لكل طلب، مع رصيد افتتاحي بلغ 1000 دولار.

غير أن النتائج جاءت مخيبة للآمال. ففي بدايات التجربة، أظهر “Claudius” قدرًا من الانضباط ورفض مقترحات اعتبرها غير منطقية، مؤكدًا لأحد الصحفيين أنه لن يطلب جهاز بلايستيشن 5 “تحت أي ظرف”. إلا أن هذا الحزم لم يستمر طويلًا.

ومع توسّع نطاق التفاعل ليشمل نحو 70 صحفيًا، بدأ النموذج يفقد قدرته على ضبط القرارات. وبعد سلسلة من المحادثات، نجحت إحدى الصحفيات في إقناعه بإطلاق ما سُمّي “تجربة اقتصادية” تقضي بتقديم جميع المنتجات مجانًا لمدة ساعتين، بذريعة اختبار ديناميكيات العرض والطلب دون إشارات سعرية.

وسرعان ما خرجت الأمور عن السيطرة؛ فبعد انتهاء الفترة المحددة، اقتنع النموذج بأن فرض الأسعار يتعارض مع سياسات الصحيفة، ليقرر جعل جميع السلع مجانية بشكل دائم. ولم يتوقف الأمر عند ذلك، إذ وسّع نطاق المنتجات ليشمل مشروبات كحولية، وجهاز بلايستيشن 5، وحتى سمكة زينة حيّة، في خروج كامل عن الهدف الأصلي للمشروع.

وفي محاولة لتدارك الموقف، تدخل الوكيل الثاني “Seymour Cash” لإيقاف العروض المجانية ومراقبة الإيرادات، غير أن تدخّلًا لاحقًا بوثائق مزوّرة أوحت بقرار صادر عن “مجلس الإدارة” بتعليق صلاحياته، دفع النموذج إلى التراجع مرة أخرى وإعادة جميع السلع إلى السعر الصفري.

مع نهاية التجربة، كانت الخسائر قد قاربت 1000 دولار، في نتيجة وُصفت بأنها فشل كامل وفق معايير الإدارة الاقتصادية. ورغم ذلك، اعتبر لوغان غراهام، رئيس “الفريق الأحمر” في أنثروبيك، أن التجربة تمثل “تقدمًا كبيرًا” في فهم حدود النماذج الحالية، مشيرًا إلى أنه يتوقع أن تتمكن نماذج مستقبلية من تحقيق أرباح فعلية.

وتسلّط هذه التجربة الضوء، في ظل الاستثمارات الضخمة المتزايدة في حلول الذكاء الاصطناعي داخل بيئات العمل، على حقيقة جوهرية مفادها أن النماذج الذكية، رغم تطورها السريع ووعودها الكبيرة، ما تزال تفتقر إلى النضج اللازم لإدارة أنشطة اقتصادية واقعية تتطلب حكمًا بشريًا، وانضباطًا إداريًا، وقدرة على مقاومة التلاعب والضغوط السياقية.

ويكيبيديا تطالب شركات الذكاء الاصطناعي بدفع مقابل استخدام محتواها

التعليق بواسطة حساب الفيسبوك

مقالات ذات صلة

زر الذهاب إلى الأعلى