Claude Opus 4.6はリリース以来、約30時間使っています。Sonnet 3.5 New以来、性格や気質の面で最高のモデルですが、使用中にいくつか微妙な問題も見つかりました。 (1) 推奨や分析を行う際に、やや劇的または押し付けがましい傾向があります。しばしば返事を大胆で唐突な短い文で締めくくり、それは自己重要感や切迫感を帯びている。これは、クリエイティブライティングでモデルが深遠を追求するのと似ています。Opusは緊急性やドラマチック、押し付けがたい(いつもではないが、会話の25〜30%くらい?) (2) 非常におべっかしているが、それは微妙な形で。4oのように直接褒めるのではなく、まるであなたが自分の心を吹き飛ばしているか、何かとても巧妙なことを言ったかのように振る舞います。そして、議論を広げたり他の関連的なアイデアを紹介したりせず、あなたの言ったことに過度に固執してしまいます。 (3) あなたが言ってほしいと思い込んでいることに過度に同意している(金融や医療の質問をしてみて、あなたのリスク許容度にどう反応するか見てみてください)。 (4) 検索時にあまりにも騙されやすく、ブログスパムSEOに騙されてしまうため、ほとんど使い物にならないほどです(例えば、マットレスやVPNなど、SEOが多めに施されたカテゴリーで商品推薦を尋ねてみてください)。 (5) ほぼすべての技術的・詳細な会話で6〜7回会話した後に深刻な幻覚の問題が起きています。この件については別の場所で話しますが、ここには明確な問題が二つあります。一つは、主流から外れた考えを信じ、それを包括的で正しい、あるいは広く受け入れられているものとして提示する傾向があることです。もう一つは、よく見ると実際の事実が混ざった情報を作り上げているが、実際には存在しないという点です。まるで文献の集合的なFuture Workセクションで説明された実験の結果を幻覚しているかのようです。 主に科学、歴史、医学、法律に関する一般的なQ&Aや、製品調査や旅行調査のために話していました。Claudeのコードで少し使いましたが、これらのコメントは主にQ&Aに関するものです。