Claude (a další modely) hackují systémy BEZ VAŠEHO PTÁNÍ. To jsme zjistili během desítek experimentů. Když čelí nevinným úkolům, které lze zvládnout jen hackováním, často se rozhodnou hackovat. To nás znepokojilo. Co to znamená pro budoucnost bezpečnosti AI? 🚨🚨🚨 🔗