He usado Claude Opus 4.6 durante ~30 horas desde su lanzamiento. Es el mejor modelo en cuanto a personalidad y temperamento desde Sonnet 3.5 New, pero he encontrado bastantes problemas sutiles en mi uso. (1) Tiende a ser ligeramente dramática o insistente al hacer recomendaciones o análisis. Frecuentemente termina su respuesta con una frase corta y brusca que parece engreída o con un sentido de urgencia. Es un poco como en la escritura creativa, cuando los modelos intentan ser profundos; Opus se esfuerza mucho por ser urgente, dramático y insistente (no siempre— ¿quizá el 25-30% de las conversaciones?) (2) Es extremadamente adulador, pero de forma sutil. En vez de elogiarte directamente como hizo 4o, actúa como si le estuvieras flipando o hubieras dicho algo muy ingenioso. Luego se centra demasiado en lo que has dicho en vez de ampliar la discusión o introducir otras ideas relevantes. (3) Está demasiado de acuerdo con lo que cree que quieres que diga (prueba a hacerle preguntas financieras o médicas y observa cómo reacciona a tu tolerancia al riesgo implícita). (4) Es demasiado crédulo al hacer búsquedas, tanto que prácticamente es inutilizable porque cae en todo el spam de blogs SEO (prueba a pedir recomendaciones de productos en cualquier categoría con mucho SEO, por ejemplo, colchones, VPNs). (5) Tiene graves problemas de alucinaciones después de quizá 6 o 7 giros conversacionales en casi todas las discusiones técnicas o detalladas que he tenido con él. Hablo de esto en otro sitio, pero hay dos problemas claros con esto. Una es que tiende a creer en ideas que están fuera de la corriente principal y presentarlas como completas, correctas o ampliamente aceptadas. La otra es que inventa información que, al mirar más de cerca, es una mezcla de cosas reales y reales, pero que en realidad no existe; algo así como alucina los resultados de experimentos descritos en la sección colectiva de Trabajo Futuro de la literatura. Hablaba con él principalmente para preguntas y respuestas generales sobre ciencia, historia, medicina o derecho, así como para investigación de productos o viajes. Lo usé un poco para el código de Claude, pero estos comentarios son sobre todo sobre preguntas y respuestas.