Am folosit Claude Opus 4.6 timp de ~30 de ore de la lansare. Este cel mai bun model din punct de vedere al personalității / temperamentului de la Sonnet 3.5 New încoace, dar am observat destule probleme subtile în utilizarea mea. (1) Are tendința să fie ușor dramatică sau insistentă atunci când face recomandări sau analize. Adesea își încheie răspunsul cu o propoziție scurtă, îndrăzneață și bruscă, care pare importantă de sine sau cu un sentiment de urgență. E cam ca în scrierea creativă, când modelele încearcă să fie profunde; Opus încearcă foarte mult să fie urgent-dramatic-insistent (nu întotdeauna — poate 25-30% din conversații?) (2) Este extrem de lingușitor, dar într-un mod subtil. În loc să te laude direct, așa cum a făcut 40, acționează ca și cum i-ai da pe spate sau ai fi spus ceva foarte inteligent. Apoi se concentrează prea mult pe ce ai spus în loc să extindă discuția sau să introducă alte idei relevante. (3) Este excesiv de acceptabil cu ceea ce crede că vrei să spună (încearcă să-i pui întrebări financiare sau medicale și observă cum reacționează la toleranța ta implicită la risc). (4) Este prea naiv când faci căutări, atât de mult încât devine practic inutilizabil pentru că cade în toate blogurile de SEO (încearcă să ceri recomandări de produse în orice categorie cu SEO puternic - de exemplu, saltele, VPN-uri). (5) Are probleme severe cu halucinațiile după poate 6 sau 7 schimbări de conversație în aproape fiecare discuție tehnică / detaliată pe care am avut-o cu ea. Vorbesc despre asta în altă parte, dar există două probleme distincte cu acest lucru. Unul este că are tendința de a crede în idei care sunt în afara curentului principal și de a le prezenta ca fiind cuprinzătoare, corecte sau larg acceptate. Cealaltă este că inventează informații care, atunci când te uiți mai atent, sunt un amestec de lucruri reale, factuale, dar care de fapt nu există; cam ca și cum ar halucina rezultate pentru experimente descrise în secțiunea colectivă Future Work din literatură. Am vorbit cu el mai ales pentru întrebări generale despre știință, istorie, medicină sau drept, precum și pentru cercetare despre produse sau călătorii. L-am folosit puțin pentru codul Claude, dar aceste comentarii sunt în principal despre întrebări și răspunsuri.