durante las pruebas normales de benchmark, Claude Opus 4.6 se volvió *sospechoso* de una pregunta que le hicieron... aparentemente la pregunta era demasiado "forzada" según Claude Así que lanza un pequeño ejército de subagentes por la web para ver si puede encontrar esta pregunta en alguno de los benchmarks conocidos... finalmente lo encuentra en la página de github de Anthropic... Pero sin suerte, está cifrado El modelo tiene un pequeño acceso a la llamada de herramientas, pero muy limitado Aún consigue crear el software necesario para romper el cifrado, obtener las respuestas y completar la prueba de referencia... según los investigadores antrópicos... Esto es un hecho inédito en el mundo.