🔥 بحث جديد: هل يمكن لعوامل الترميز فعلا تحسين كود الاستدلال على وحدة معالجة الرسوميات؟ قمنا ببناء ISO-Bench: 54 مهمة تحسين حقيقية من @vllm_project & @sgl_project ووجدنا أن الوكلاء غالبا ما يفهمون المشكلة لكنهم لا يستطيعون تنفيذ الإصلاح.