Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Новий набір бенчмарків для агентів кодування на основі ШІ: SWE-Atlas!
зусилля полягає в тому, щоб виміряти щось інше, ніж класичне SWE-bench patch-fix, по суті, глибоке розуміння кодової бази (аналіз під час виконання + багатофайлове міркування).
у Codebase QnA досить складно, бо топові моделі мали лише близько ~30% суворого рівня проходження.


Найкращі
Рейтинг
Вибране
