Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Probabil aceasta este prima lucrare RL pe OpenClaw 🔥
MetaClaw: Vorbește cu agentul tău și lasă-l să evolueze automat.
Github:
Majoritatea agenților AI sunt înghețați în momentul în care sunt livrați. Fiecare greșeală pe care o fac, o vor face din nou mâine. MetaClaw rezolvă asta.
Este un strat RL online construit peste OpenClaw care le permite agenților să învețe din propriile interacțiuni — fără cluster GPU, fără set de date offline, fără echipă de inginerie necesară.
Bucla este simplă: fiecare conversație este înregistrată ca o traiectorie de antrenament. Când agentul eșuează, analizează ce a mers prost și propune o nouă abilitate reutilizabilă. LoRA actualizează trenul asincron în fundal. Data viitoare când apare o situație similară, abilitatea relevantă este preluată automat în prompt.
Agentul nu doar acumulează conversații. Acumulează capacitate.
Ce face ca acest lucru să fie diferit de fine-tuning: nu există un pipeline uman de etichetare, nicio rulare de antrenament batch, niciun ciclu de implementare. Îmbunătățirea are loc continuu, invizibil, în producție. Interacțiunea → învățarea → îmbunătățirea, în buclă.
Nu există set de date offline. Nu este nevoie de programare. Fără cluster GPU.
Partea care merită atentă: aceasta transformă fiecare interacțiune a utilizatorului într-un semnal de antrenament. Agentul pe care îl trimiți în prima zi nu este agentul pe care îl ai în ziua treizeci. A fost modelat de tot ce a greșit și a reparat.
O treabă grozavă din partea @HuaxiuYaoML!
Limită superioară
Clasament
Favorite
