المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
هل تريد الحصول على وكيل LLM للنجاح في بيئة OOD؟
نتعامل مع أصعب حالة مع SPA (وكيل اللعب الذاتي). لا توجد بيانات إضافية أو أدوات أو نماذج أقوى. اللعب الذاتي الخالص.
نقوم أولا باستيعاب نموذج عالمي عبر Self-Play ، ثم نتعلم كيفية الفوز من خلال RL.
مثل طفل يلعب مع البيئة للتعرف ببساطة على "ماذا لو فعلت هذا؟"
أدناه ، نعرض النتائج التي توصلنا إليها حول: ما هو الخطأ في بيئات OOD؟ ما هي العوامل الرئيسية التي تسمح للعب الذاتي بالنجاح؟
(1/8)

الأفضل
المُتصدِّرة
التطبيقات المفضلة
