تقديم NVIDIA Nemotron 3 Super 🎉 نموذج MoE الهجين المفتوح ب 120B (نشط 12B نشط) سياق الرمز الأصلي ل1M تم تصميمه لتطبيقات متعددة الوكلاء عالية الدقة وكفاءة الحوسبة بالإضافة إلى ذلك، أوزان مفتوحة بالكامل، مجموعات بيانات ووصفات سهلة التخصيص والنشر. 🧵
هذه الإضافة الأخيرة إلى عائلة نيموترون ليست مجرد نانو أكبر. ✅ تصل إلى معدل نقل بيانات أعلى بخمس مرات ودقة مرتين أكثر من النسخة السابقة ✅ وزارة التربية الكامنة تستدعي أربعة أضعاف عدد المتخصصين الخبراء بنفس تكلفة الاستدلال ✅ توقع متعدد الرموز يقلل بشكل كبير من وقت التوليد ✅ يوفر العمود الفقري الهجين لماما ومتحول الذاكرة وكفاءة الحوسبة المحسنة بأربعة أضعاف ✅ تم تحسين التدريب المسبق ل NVFP4 الأصلي ل NVIDIA Blackwell اطلع على التعمق في القرارات المعمارية وطرق التدريب وراء النموذج 👇
🦞تتكامل هذه الابتكارات لخلق نموذج مناسب جدا للوكلاء المستقلين طويل الأمد. في PinchBench—وهو معيار لتقييم نماذج اللغة الكبيرة كعوامل ترميز @OpenClaw—حصل Nemotron 3 Super على تقييم 85.6٪ عبر مجموعة الاختبار الكاملة، مما يجعله أفضل نموذج مفتوح في فئته.
@openclaw "NVIDIA Nemotron 3 Super: القائد الجديد في الذكاء المفتوح والفعال"
Artificial Analysis
Artificial Analysisمنذ 8 ساعاتٍ
أصدرت NVIDIA نموذج Nemotron 3 Super، وهو نموذج تفكير أوزان مفتوحة بسعة 120B (نشط 12B) يحصل على تقييم 36 في مؤشر الذكاء التحليلي الاصطناعي، مع بنية هجينة بين مامبا-محول MoE حصلنا على الوصول إلى هذا النموذج قبل الإطلاق وقيموه من حيث الذكاء والانفتاح وكفاءة الاستدلال. النقاط الرئيسية ➤ يجمع بين الانفتاح العالي والذكاء القوي: أداء Nemotron 3 Super بقوة بالنسبة لحجمه وهو أكثر ذكاء بكثير من أي نموذج آخر ذو انفتاح مماثل ➤ حصل Nemotron 3 Super على 36 نقطة في مؤشر الذكاء التحليلي الاصطناعي، متقدما +17 نقطة على الإصدار السابق Super و+12 نقطة عن Nemotron 3 Nano. مقارنة بالنماذج ذات الفئة المشابهة من الحجم، هذا يضعه في المقدمة على GPT-OSS-120B (33)، لكنه خلف Qwen3.5 122B A10B الذي تم إصداره مؤخرا (42). ➤ التركيز على الذكاء الفعال: وجدنا أن Nemotron 3 Super يتمتع بذكاء أعلى من gpt-oss-120b مع تمكين ~10٪ زيادة في معدل نقل لكل وحدة معالجة رسومية في اختبار تحميل بسيط لكنه واقعي ➤ مدعوم اليوم للاستدلال السريع بدون خادم: مزودون مثل @DeepInfra و@LightningAI يخدمون هذا النموذج عند الإطلاق بسرعات تصل إلى 484 رمزا في الثانية تفاصيل النموذج 📝 يحتوي Nemotron 3 Super على 120.6 مليار معلمة بإجمالي و12.7 مليار معلمة نشطة، بالإضافة إلى نافذة سياق بقيمة مليون رمز ودعم للتفكير الهجين. ينشر بأوزان مفتوحة ورخصة متساهلة، إلى جانب بيانات التدريب المفتوحة والإفصاح عن المنهجية 📐 يحتوي النموذج على عدة ميزات تصميم تتيح الاستدلال الفعال، بما في ذلك استخدام هياكل هجينة بين مامبا-ترانسفورمر وLatentMoE، والتنبؤ بعدة رموز، وأوزان كمية NVFP4 🎯 NVIDIA دربت Nemotron 3 Super مسبقا بدقة NVFP4 (في الغالب)، لكنها انتقلت إلى BF16 بعد التدريب. تستخدم درجات التقييم لدينا أوزان BF16 🧠 قمنا بمقارنة نيموترون 3 سوبر في وضع الاستدلال الأعلى جهدا ("العادي"), وهو الأكثر قدرة من بين أوضاع الاستدلالات الثلاثة في النموذج (الاستدلال، منخفض الجهد، والمنتظم)
@openclaw ✨ Nemotron 3 Super متاح الآن لمشتركي @Perplexity_ai Pro وMax في قائمة اختيار الطرازات المنسدلة. يمكن أيضا استخدامه من خلال واجهة برمجة تطبيقات الوكيل وكمبيوتر بيربلكسيتي.
‏‎204‏