2026年春、Anthropicが公開した「Claude Opus 4.8」は、コード生成や長時間エージェント作業において大幅な進化を遂げたとして話題を呼んだ。特に、Anthropic公式の発表ページでは、「大規模なエージェントワークフロー」「動的推論」「Claude Code強化」が前面に押し出され、“AIコーディングの本命”として期待を集めた。 (Anthropic)

しかし、リリースから数週間。開発者コミュニティでは、別の話題が盛り上がっている。

「Opus 4.8、なんか調子悪くない?」

SNS、Reddit、開発者フォーラムを中心に、「以前より挙動が不安定」「Claude Codeで妙な動きをする」といった声が相次ぎ、いわゆる“Opus 4.8不調説”が静かに広がっている。もちろん、これはAnthropic公式が認めた問題ではなく、現時点ではユーザー観測ベースの疑惑だ。しかし、これほど同じ方向の報告が集まると、単なる気のせいとも言い切れない。

では、何が起きているのか。

「賢いが、妙に遅い」――最初に出た違和感

もっとも多い指摘の一つが、**「慎重すぎる」**という評価だ。

RedditのClaude Codeコミュニティでは、Opus 4.8について「4.7より賢いが、極端に細かく確認しながら進める」「小さく刻みすぎて作業速度が落ちた」といった声が目立つ。特に大規模リファクタリングや複数ファイル編集で、「必要以上に確認を挟む」「保守的になった」という印象を受けるユーザーが多いようだ。 (Reddit)

一方で、Anthropic側はこれをある種“仕様”として説明している。Opus 4.8では「adaptive thinking(適応推論)」が導入され、問題の難易度に応じて思考量を変える設計になった。安全性や精度向上のため、以前より深く考える傾向があるという。 (Claude Platform)

つまり、「遅くなった」のではなく、**“より慎重になった結果、体感が変わった”**可能性もある。

Claude Code特有の“ツール呼び出し問題”

もう一つ、開発者の間で深刻視されているのが、Claude Codeでのツール実行不具合だ。

特に話題になった投稿では、「Opus 4.8だけツール呼び出しがおかしい」「無限ループ気味になる」「CLI操作が崩れる」といった指摘が出ている。ファイル編集やコマンド実行など、Claude Codeのエージェント機能が正常に噛み合わず、意図しない再試行を繰り返すケースが報告されている。 (Reddit)

開発者からは、

「4.8は天才かポンコツかのどちらか」

という半ば冗談めいたコメントも見られる。

これは単純なモデル性能ではなく、モデル × ツール実装 × ワークフロー設計の複合問題かもしれない。Opus 4.8はエージェント能力を大きく引き上げた一方、複雑化した内部挙動がClaude Codeとの相性問題を生んでいる可能性がある。

「前より口うるさい」問題

意外に多いのが、**“反論が増えた”**という不満だ。

4.8は以前のClaudeに比べ、「それは危険です」「その設計は問題があります」と積極的に指摘する傾向が強いという声がある。あるユーザーは「以前より議論好きになった」と表現している。 (Reddit)

背景には、Anthropicが近年強化している**“sycophancy(迎合)対策”**があると見られる。つまり、ユーザーに何でも同意するのではなく、間違っていれば指摘する方向に調整されている可能性だ。

これを「品質向上」と見る人もいれば、「余計なお世話」と感じる人もいる。

特にコーディング用途では、「言われた通りに直してほしいのに、設計論を始める」とストレスを感じる場面があるようだ。

それでもベンチマークは強い

一方で、「不調説」がそのまま性能低下を意味するわけではない。

研究ベンチマークでは、Claude Opus 4.8は依然として非常に高い成績を示している。エージェント性能を測る研究では、高いタスク成功率と安全性を示したとの報告もある。 (arXiv)

コミュニティでも、

「短いタスクでは微妙だが、長時間作業は4.8が圧倒的」

「設計済みの大規模実装は4.7より安定」

と評価する声も少なくない。 (Reddit)

つまり現状の評価を一言でまとめるなら、

“能力は上がったが、扱い方が変わった”

というのが近いのかもしれない。

不調なのか、チューニング不足なのか

「Opus 4.8が調子悪い」という話は、実際には複数の現象が混ざっている。

  • 推論が深くなりレスポンスが重く感じる
  • Claude Codeとの相性問題
  • 反論や慎重さが増えた人格変化
  • プロンプト設計が旧モデル前提のまま

特にClaude Codeは、モデルアップデート時に“最適な使い方”が変わることが多い。4.6向けプロンプトをそのまま4.8に流し込むと、期待した挙動にならないという指摘もある。 (Reddit)

現時点では、「Opus 4.8は壊れている」というより、**“成熟途中のクセ強モデル”**という見方が妥当だろう。

そしてAnthropicは過去にも、リリース後にシステムプロンプトや内部挙動を微調整してきた。今後数週間で、ユーザー体感が変わる可能性は十分ある。

関連URL

By tokita