Lansering av PPO, en ny klass av förstärkningsinlärningsalgoritmer som utmärker sig på simulerade robotikuppgifter: