إطلاق نماذج DeepSeek الجديدة منافسة قوية لأداء نماذج OpenAI في الذكاء الاصطناعي

أعلنت شركة DeepSeek الصينية عن إطلاق نماذج ذكاء اصطناعي جديدة تحت مسميين: R1 و R1-Zero، حيث ادعت أن هذه النماذج تضاهي أداء نماذج التفكير المنطقي المتقدمة من OpenAI، مثل نموذج o1، الذي يتسم بتقنيات تحليل وتقييم معقدة تستغرق بعض الوقت قبل إنتاج الإجابات.

 

تمثل نماذج R1 و R1-Zero خطوة مهمة نحو تطوير أساليب تعلم جديدة، حيث يعتمدان على تقنيات التعلم المعزز (Reinforcement Learning) لتدريب النماذج على استدلالات معقدة دون الحاجة إلى أمثلة بشرية. وتستخدم هذه النماذج نظامًا مبسّطًا للمكافآت وقواعد واضحة للتحقق من صحة الإجابات، مثل التحقق من حلول المسائل الرياضية وبرمجة التعليمات.

 

من جانب آخر، طوّرت DeepSeek خوارزمية مبتكرة تعمل على تقييم مجموعات من الإجابات بدلاً من تقييم كل إجابة على حدة، مما ساعد على تحسين الأداء بشكل فعال. ورغم إمكانياته الواعدة، واجه نموذج R1-Zero تحديات تتعلق بصعوبة قراءة الإجابات وخلط اللغات، وهو ما دفع الشركة إلى إطلاق نموذج R1، الذي يبدأ بتدريب أولي على بيانات صغيرة قبل أن يخضع لعدة جولات من التعلم المعزز لتحسين أدائه.

 

أظهرت الاختبارات أن نموذج DeepSeek-R1 قد حقق نتائج مشابهة لنموذج OpenAI-o1-1217 عبر عدة معايير استدلالية، ما يعكس قدرته على منافسة نماذج الذكاء الاصطناعي الرائدة.

 

بالإضافة إلى النماذج الأكبر، قامت DeepSeek بإطلاق 6 نماذج صغيرة تتراوح بين 1.5 إلى 70 مليار معلمة، والتي استخدمت 800 ألف مثال تدريبي تم توليده من خلال نموذج R1 الأكبر. وقد أثبتت هذه النماذج الصغيرة (المقطّرة)، مثل R1-Distill-Llama-70B و R1-Distill-Qwen-32B، قدرتها الاستدلالية القوية وتفوقها على العديد من النماذج الأكبر حجمًا.

 

وتتوفر نماذج DeepSeek-R1 تحت رخصة MIT، مما يتيح للمطورين استخدامها وتخصيصها بحرية. يمكن الوصول إلى هذه النماذج عبر منصتي GitHub و HuggingFace أو من خلال واجهة برمجية (API) خاصة بالشركة بأسعار منافسة تتيح استخدامها بشكل اقتصادي مقارنة بنماذج OpenAI.

 

هذا الإطلاق يأتي بعد إطلاق DeepSeek نموذجها DeepSeek-V3، الذي يُعتبر من أقوى النماذج المفتوحة المصدر في العالم، حيث ينافس نماذج مثل GPT-4o.

انقطاع مفاجئ في خدمة ChatGPT يشل الوصول إليها عالمياً

التعليق بواسطة حساب الفيسبوك
Exit mobile version