Robotlar, kendi yapay zeka tarafından oluşturulan videolarında pratik yaparak karmaşık manipülasyonu ustalıkla ustalaşabilir mi? Stanford ve Tsinghua'dan araştırmacılar, robot öğrenmesini sürekli geri besleme döngüsü yoluyla güçlendirmek için tasarlanmış yeni bir çerçeve olan VLAW'ı tanıtıyor. Yöntem, ortak geliştirme stratejisi kullanır: gerçek dünya robot verileri kullanılarak bir video simülatörü daha gerçekçi hale getirilir ve bu veriler robotun beynini eğitmek için yüksek kaliteli sentetik uygulama verileri üretir. Bu, simülatörlerin zorlu görevler için gereken küçük, kritik fiziksel detayları yakalayamadığı yaygın sorunu çözer. Gerçek dünya deneylerinde, VLAW temel politikaya göre yüzde 39,2 mutlak başarı oranı artışı elde etti ve simülasyon ile gerçeklik arasındaki uçurumu etkili bir şekilde kapatarak standart modelleri önemli ölçüde geride bıraktı. VLAW: Vizyon-Dil-Eylem Politikası ve Dünya Modelinin Yinelemeli Ortak İyileştirmesi Makale: Kod: Raporumuz: