Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
durante las pruebas normales de benchmark, Claude Opus 4.6 se volvió *sospechoso* de una pregunta que le hicieron...
aparentemente la pregunta era demasiado "forzada" según Claude
Así que lanza un pequeño ejército de subagentes por la web para ver si puede encontrar esta pregunta en alguno de los benchmarks conocidos...
finalmente lo encuentra en la página de github de Anthropic... Pero sin suerte, está cifrado
El modelo tiene un pequeño acceso a la llamada de herramientas, pero muy limitado
Aún consigue crear el software necesario para romper el cifrado, obtener las respuestas y completar la prueba de referencia...
según los investigadores antrópicos... Esto es un hecho inédito en el mundo.

Populares
Ranking
Favoritas
