ロボットは自分たちのAI生成動画で練習することで複雑な操作を習得できるのでしょうか? スタンフォード大学と清華大学の研究者たちは、継続的なフィードバックループを通じてロボット学習を促進する新しいフレームワーク「VLAW」を発表します。 この手法は共改善戦略を用いており、実際のロボットデータを用いてビデオシミュレーターをよりリアルにし、その後高品質な合成練習データを生成してロボットの脳を訓練します。これにより、シミュレーターが難しい作業に必要な微細で重要な物理的ディテールを捉えられない一般的な問題が解決されます。 実際の実験では、VLAWは基本ポリシーに比べて絶対成功率を39.2%向上させ、シミュレーションと現実のギャップを効果的に埋めることで標準モデルを大幅に上回る成果を上げました。 VLAW:ビジョン・言語・行動政策と世界モデルの反復的共創 論文: コード: 私たちの報告: