تصدّر نموذج الذكاء الاصطناعي Grok-3 من شركة xAI مؤخرًا قائمة التصنيف في منصة LMarena.
وتفوق Grok-3 على نماذج أخرى مثل ChatGPT o3mini وo1 وDeepseek-R1 وGemini-2 Flash Thinking.
وجرى تقييم أداء Grok-3 عبر عدة فئات، تمكن فيها من الحصول على المرتبة الأولى من حيث المطالبات الصعبة (Hard Prompts) والمتمثلة في قدرة النموذج على التعامل مع الأسئلة والتحديات المعقدة.
ومن بين الفئات أيضا البرمجة (Coding)، من حيث كفاءة النموذج في كتابة وفهم الأكواد البرمجية، والرياضيات (Math) من خلال مهارات النموذج في حل المسائل الرياضية.
إلى جانب الكتابة الإبداعية (Creative Writing)، من حيث إبداعية النموذج في إنتاج نصوص أدبية وفنية، إضافة إلى اتباع التعليمات (Instruction Following) من خلال مدى دقة النموذج في تنفيذ التعليمات المقدمة له، والاستفسارات الطويلة (Longer Query) عبر فعالية النموذج في معالجة الاستفسارات المطولة والمعقدة.
وأشارت هذه النتائج إلى تفوق Grok-3 في مجموعة متنوعة من المهام، مما يعكس تقدمه في مجالات متعددة مقارنة بنماذج الذكاء الاصطناعي الأخرى.