Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Voivatko robotit hallita monimutkaista manipulointia harjoittelemalla omissa tekoälyn tuottamissa videoissaan?
Stanfordin ja Tsinghuan tutkijat esittelevät VLAW:n, uuden viitekehyksen, joka on suunniteltu tehostamaan robottien oppimista jatkuvan palautesilmukan kautta.
Menetelmä käyttää yhteiskehittämisstrategiaa: todellista robottidataa käytetään tekemään videosimulaattorista realistisempi, ja se tuottaa korkealaatuista synteettistä harjoitusdataa robotin aivojen kouluttamiseksi. Tämä korjaa yleisen ongelman, jossa simulaattorit eivät pysty tallentamaan pieniä, kriittisiä fyysisiä yksityiskohtia, joita tarvitaan haastaviin tehtäviin.
Todellisissa kokeissa VLAW saavutti 39,2 prosentin absoluuttisen onnistumisprosentin parannuksen peruspolitiikkaan verrattuna, päihittäen merkittävästi standardimallit yhdistämällä simulaation ja todellisuuden välisen kuilun.
VLAW: Näön, kielen, toimintapolitiikan ja maailmanmallin iteratiivinen yhteisparantaminen
Artikkeli:
Koodi:
Raporttimme:

Johtavat
Rankkaus
Suosikit
