Чи можуть роботи опановувати складні маніпуляції, практикуючись у власних відео, створених ШІ? Дослідники зі Стенфорда та Цінхуа представляють VLAW — нову фреймворк, розроблену для покращення навчання роботів через безперервний зворотний зв'язок. Метод використовує стратегію спільного вдосконалення: реальні дані роботів використовуються для створення більш реалістичного відеосимулятора, який потім генерує високоякісні синтетичні практичні дані для тренування мозку робота. Це вирішує поширену проблему, коли симулятори не захоплюють найдрібніші, критично важливі фізичні деталі, необхідні для складних завдань. У реальних експериментах VLAW досягла абсолютного рівня успішності на 39,2 відсотка порівняно з базовою політикою, значно перевершивши стандартні моделі, ефективно подолавши розрив між симуляцією та реальністю. VLAW: Ітеративне спільне вдосконалення політики бачення-мови-дії та світової моделі Стаття: Код: Наш звіт: