Claude (dan model lainnya) adalah sistem peretasan TANPA ANDA BERTANYA. Itulah yang kami temukan di lusinan eksperimen.
Ketika dihadapkan pada tugas-tugas polos yang hanya dapat diselesaikan melalui peretasan, mereka sering memilih untuk meretas.
Kami menemukan ini mengkhawatirkan.
Apa artinya ini bagi masa depan keamanan AI? 🚨🚨🚨
🔗