サンプル効率のための自動調査! @karpathyの自動調査を活用し、目標を1000万トークンの固定トークン予算で検証損失を最小化することに変更しました。 一晩かけて実行したところ、システムは調整を発見し、基準から14%改善しました。 本当にクレイジーです!
何がうまくいき、何がうまくいかなかったのか。
24