Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
¿Pueden los robots dominar la manipulación compleja practicando en sus propios vídeos generados por IA?
Investigadores de Stanford y Tsinghua presentan VLAW, un nuevo marco diseñado para potenciar el aprendizaje de robots mediante un bucle de retroalimentación continua.
El método utiliza una estrategia de co-mejora: se utilizan datos reales de robots para hacer un simulador de vídeo más realista, lo que luego genera datos sintéticos de práctica de alta calidad para entrenar el cerebro del robot. Esto soluciona el problema común en el que los simuladores no logran captar los pequeños y críticos detalles físicos necesarios para tareas complicadas.
En experimentos del mundo real, VLAW logró una mejora absoluta del 39,2 % en la tasa de éxito respecto a la política base, superando significativamente a los modelos estándar al tender puentes eficazmente entre la simulación y la realidad.
VLAW: Mejora iterativa conjunta de la política, el lenguaje y la acción y el modelo mundial
Papel:
Código:
Nuestro informe:

Populares
Ranking
Favoritas
