Autoresearch dla efektywności próbkowania! Wziąłem autoresearch @karpathy'ego i zmieniłem cel na minimalizację straty walidacyjnej przy stałym budżecie tokenów wynoszącym 10M tokenów. Uruchomiłem to na noc i system odkrył poprawki, które doprowadziły do 14% poprawy w porównaniu do podstawy. Jak szalone!
Co zadziałało, a co nie.
57