Czy roboty mogą opanować skomplikowaną manipulację, ćwicząc w swoich własnych filmach generowanych przez AI? Naukowcy z Uniwersytetu Stanforda i Tsinghua wprowadzają VLAW, nową ramę zaprojektowaną w celu zwiększenia uczenia się robotów poprzez ciągłą pętlę informacji zwrotnej. Metoda ta wykorzystuje strategię współdoskonalenia: dane z rzeczywistego świata są używane do uczynienia symulatora wideo bardziej realistycznym, co następnie generuje wysokiej jakości syntetyczne dane do treningu mózgu robota. To rozwiązuje powszechny problem, w którym symulatory nie uchwycają drobnych, krytycznych szczegółów fizycznych potrzebnych do skomplikowanych zadań. W eksperymentach w rzeczywistym świecie VLAW osiągnęło 39,2 procent poprawy wskaźnika sukcesu w porównaniu do podstawowej polityki, znacznie przewyższając standardowe modele, skutecznie łącząc symulację z rzeczywistością. VLAW: Iteracyjne Współdoskonalenie Polityki Wizji-Języka-Działania i Modelu Świata Artykuł: Kod: Nasz raport: