تطور الذكاء الاصطناعي: كيف يمكن لوكيل OpenAI الجديد تغيير طريقة تعاملنا مع المهام الرقمية؟

خلال الأسابيع القليلة الماضية، أطلقت شركة OpenAI ميزة جديدة تُدعى “ChatGPT Tasks”، التي تتيح للمستخدمين جدولة المهام والتذكيرات ليقوم روبوت الدردشة بتنفيذها في وقت لاحق. وفي الوقت ذاته، انتشرت شائعات حول تطوير الشركة لوكيل ذكاء اصطناعي جديد يحمل الاسم الرمزي “Operator”، والذي كان من المتوقع أن يُطرح في يناير. وبالفعل، تم الكشف عن هذا الوكيل بعد أسبوع من إطلاق ميزة المهام.

 

يشير هذا التطور إلى تحول كبير في مجال الذكاء الاصطناعي، حيث بدأنا نرى نقلة نوعية من أدوات الذكاء الاصطناعي التقليدية التي تقتصر على معالجة المعلومات، إلى وكلاء يمكنهم العمل بشكل مستقل دون الحاجة لتدخل بشري.

 

ما هو وكيل الذكاء الاصطناعي؟

تقليديًا، يقتصر دور الذكاء الاصطناعي على تقديم النصائح، معالجة النصوص، أو المساعدة في بعض المهام البسيطة. لكن مع تطور وكلاء الذكاء الاصطناعي مثل “Operator” من OpenAI، و”Computer Use” من Anthropic، و”Project Mariner” من جوجل، بدأنا نرى أنظمة يمكنها العمل باستقلالية واتخاذ قرارات جديدة بناءً على تفاعلاتها مع بيئاتها المتغيرة. هؤلاء الوكلاء ليسوا مقيدين بقواعد محددة مسبقًا أو بيانات ثابتة، بل يتمتعون بقدرة على التعلم والتكيف مع المواقف الجديدة.

 

ماذا يمكن لوكيل OpenAI “Operator” أن يفعل؟

وكيل “Operator” هو نظام ذكاء اصطناعي متطور قادر على التفاعل مع واجهات الويب كما يفعل الإنسان. يمكنه التقاط لقطات شاشة، فهم التصاميم البصرية، اتخاذ قرارات بشأن أماكن النقر، الكتابة، والتنقل داخل المواقع. هذا الوكيل يعمل بشكل مشابه للبشر، حيث يتعامل مع الإنترنت مباشرة، ويتخذ خطوات ملموسة لإتمام المهام مثل التسوق، التوصيل، طلب الطعام، أو حجز السفر. كما أنه يتيح للمستخدم مراقبة سير العمل في الوقت الفعلي، مع إمكانية التدخل في أي مرحلة.

 

يعتمد “Operator” على نموذج الذكاء الاصطناعي “Computer-Using Agent” (CUA)، الذي يجمع بين قدرات الرؤية والتحليل البصري لنموذج GPT-4، ويتميز بقدرة الاستدلال الذكي من خلال التفاعل مع واجهات الويب بطريقة مشابهة للبشر، دون الحاجة لاستخدام واجهات برمجة التطبيقات المخصصة.

 

أداء “Operator” في الاختبارات

حقق “Operator” أداءً مميزًا في عدة اختبارات:

 

WebVoyager Benchmark: 87% نجاح في التعامل مع مواقع ويب حقيقية مثل Amazon وGoogle Maps.

WebArena Benchmark: 58.1% نجاح في التعامل مع مواقع افتراضية تتعلق بالتسوق وإدارة المحتوى.

OSWorld Benchmark: 38.1% نجاح في التعامل مع مهام معقدة متعددة الخطوات على مواقع افتراضية مثل دمج ملفات PDF من رسائل البريد الإلكتروني.

تُظهر هذه النتائج أن “Operator” يتفوق في البيئات المألوفة والواقعية، وهو يشبه إلى حد بعيد كيفية تعلم البشر: نحن نؤدي بشكل أفضل في البيئات التي نعرفها.

 

كيفية الوصول إلى “Operator”

حاليًا، توفر OpenAI “Operator” لمستخدمي ChatGPT Pro في الولايات المتحدة بتكلفة 200 دولار شهريًا، مع خطط لتوسيع الوصول إلى الاشتراكات الأخرى مثل Plus و Team و Enterprise في المستقبل القريب. كما تخطط الشركة لإتاحة نموذج CUA عبر واجهات برمجة التطبيقات للمطورين لإنشاء وكلاء ذكاء اصطناعي مخصصين.

 

الخاتمة

نشهد تحولًا كبيرًا في مجال الذكاء الاصطناعي، حيث تجاوزت الأدوات التقليدية حدود الإجابة على الأسئلة إلى القدرة على اتخاذ الإجراءات الفعّالة. مع تطور الوكلاء مثل “Operator”، ستتغير الطريقة التي نتعامل بها مع مهامنا اليومية عبر الإنترنت، مثل البحث عن وجهات السفر، ملء النماذج، أو جمع البيانات من مصادر متعددة. ومع مرور الوقت، سيصبح “Operator” قادرًا على تنفيذ مهام أكثر تعقيدًا، مما يعزز الإنتاجية وييسر سير العمل.

 

إذا تعلمنا كيفية استخدام وكلاء الذكاء الاصطناعي بشكل صحيح، سيكون لدينا أداة قوية لتحسين كفاءتنا وتعزيز قدرتنا على إنجاز المهام بشكل أسرع وأكثر فعالية.

التعليق بواسطة حساب الفيسبوك
Exit mobile version