Dokážou roboti zvládnout složitou manipulaci tím, že budou cvičit ve svých vlastních videích generovaných umělou inteligencí? Výzkumníci ze Stanfordu a Tsinghua představují VLAW, nový rámec navržený k podpoře učení robotů prostřednictvím kontinuální zpětné vazby. Metoda využívá strategii společného zlepšování: reálná robotická data jsou použita k tomu, aby video simulátor byl realističtější, a on pak generuje vysoce kvalitní syntetická praxe pro trénink mozku robota. Tím se řeší běžný problém, kdy simulátory nedokážou zachytit drobné, kritické fyzické detaily potřebné pro složité úkoly. V reálných experimentech dosáhl VLAW zlepšení absolutní úspěšnosti o 39,2 procenta oproti základní politice, výrazně překonávajíc standardní modely tím, že efektivně překlenul propast mezi simulací a realitou. VLAW: Iterativní společné zlepšování politiky vize, jazyka a akce a světového modelu Článek: Kód: Naše zpráva: