Lansering av PPO, en ny klasse forsterkende læringsalgoritmer som utmerker seg i simulerte robotikkoppgaver: