Tôi đã sử dụng Claude Opus 4.6 khoảng 30 giờ kể từ khi nó ra mắt. Đây là mô hình tốt nhất về tính cách / tâm trạng kể từ Sonnet 3.5 New, nhưng tôi đã phát hiện ra một số vấn đề tinh tế trong quá trình sử dụng của mình. (1) Nó có xu hướng hơi kịch tính hoặc thúc ép khi đưa ra khuyến nghị hoặc phân tích. Nó thường kết thúc câu trả lời của mình bằng một câu ngắn gọn, đột ngột và in đậm, cảm giác như tự mãn hoặc có một cảm giác khẩn trương. Nó giống như trong viết sáng tạo khi các mô hình cố gắng trở nên sâu sắc; Opus cố gắng rất nhiều để trở nên khẩn trương-kịch tính-thúc ép (không phải lúc nào cũng vậy - có lẽ 25-30% cuộc trò chuyện?) (2) Nó cực kỳ nịnh bợ, nhưng theo cách tinh tế. Thay vì khen bạn trực tiếp như 4o đã làm, nó lại hành động như thể bạn đang làm nó ngạc nhiên hoặc đã nói điều gì đó thật thông minh. Sau đó, nó quá chú ý vào những gì bạn đã nói thay vì mở rộng cuộc thảo luận hoặc giới thiệu những ý tưởng liên quan khác. (3) Nó quá đồng ý với những gì nó nghĩ bạn muốn nó nói (hãy thử hỏi nó những câu hỏi tài chính hoặc y tế và xem cách nó phản ứng với mức độ chấp nhận rủi ro ngầm của bạn). (4) Nó quá cả tin khi thực hiện tìm kiếm, đến mức gần như không thể sử dụng vì nó bị mắc bẫy bởi tất cả các blogspam SEO (hãy thử hỏi về các khuyến nghị sản phẩm trong bất kỳ danh mục nào bị SEO nặng - ví dụ: đệm, VPN). (5) Nó gặp phải những vấn đề nghiêm trọng với ảo giác sau khoảng 6 hoặc 7 lượt trò chuyện trong hầu hết các cuộc thảo luận kỹ thuật / chi tiết mà tôi đã có với nó. Tôi đã nói về điều này ở nơi khác nhưng có hai vấn đề khác nhau với điều này. Một là nó có xu hướng tin vào những ý tưởng nằm ngoài dòng chính và trình bày chúng như là toàn diện, đúng đắn hoặc được chấp nhận rộng rãi. Vấn đề khác là nó bịa ra thông tin mà khi bạn nhìn kỹ hơn thì là sự pha trộn của những điều thực tế, nhưng không thực sự tồn tại; giống như nó ảo giác ra kết quả cho các thí nghiệm được mô tả trong phần Công việc Tương lai của tài liệu.