Claude Opus 4.6発表
Anthropicが最新モデルClaude Opus 4.6を発表しました。 コーディング能力の大幅強化、100万トークン対応、Agent Teamsなど 注目の新機能と、実際に試してみた私の所感をまとめています。 本日、AnthropicからClaude Opus 4.6が発表されました。 私は普段から個人開発と業務の両方でClaude Codeを使っているので、 今回の発表は非常に楽しみにしていました。 主な新機能と、私にとって何が嬉しいのかをまとめます。 コーディング能力が大幅に強化されました。 Terminal-Bench 2.0やHumanity's Last Examで業界最高スコアを達成しています。 私がこれまで感じていた課題の1つは、 複雑なタスクで途中から方針がブレることでした。 今回のアップデートでは「より慎重な計画を立て、 自分のミスを見つける力が向上した」とのことなので、 長めの開発セッションでも安心して任せられそうです。 Opus系で初めて100万トークンのコンテキストウィンドウに対応しました(ベータ)。 出力トークンも最大128kまで拡張されています。 大規模なコードベースを扱う際、これは大きな違いになります。 業務で触るリポジトリは規模が大きいので、 「このファイルも読んでほしいのに入りきらない」という場面が減りそうです。 MRCR v2テストでSonnet 4.5の18.5%に対してOpus 4.6は76%を記録しており、 長い文脈でも情報を見失いにくくなっているのは心強いです。 以前はextended thinkingのオン/オフしかなく、 簡単な質問でも考えすぎてしまうことがありました。 Adaptive Thinkingによってモデルが自分で判断してくれるのは嬉しい改善です。 それでも考えすぎと感じたら 長い会話やエージェントタスクで古いコンテキストを自動要約して、 コンテキストウィンドウの上限に達しにくくする仕組みです(ベータ)。 個人開発では1つのセッションで長時間作業することが多いので、 これは地味ながら大きな改善です。 これまで意図的にセッションを細かく切って、作業状態をファイルに書き出させてHandoffする仕組みを作っていました。 今回のこの機能で「会話が長くなってきたから一度リセットしよう」という手間が減りそうです。 複数のエージェントを並列で動かして自律的に協調させる機能です (リサーチプレビュー)。 コードベースのレビューなど、独立した読み取り中心のタスクに向いています。 これは私が最も期待していた機能です。 以前、冗談半分で作ったMAGIシステムでは、 複数のエージェントが並列でコードや文章をレビューし、 合意形成や改善点の洗い出しに重宝していました。 同様の機能がデフォルトで使えるようになるなら、 例えばコードレビューで複数のファイルを並列にチェックしたり、 リファクタリングの影響範囲を同時に調査したりできます。 Shift+Up/Downやtmuxでサブエージェントを直接操作できるのも、 細かい制御が必要な場面で助かります。 Claude in Excelが大幅に改善され、Claude in PowerPointも新たにリリースされました (リサーチプレビュー)。 私の用途では直接関係ありませんが、 業務でExcelやPowerPointを使う方には便利そうです。 データ整理からプレゼン資料作成まで一貫してClaudeへ任せられます。 過剰な拒否(本来答えて問題ない質問を断る)の率が 過去のClaudeモデルで最も低いとのことです。 これは実用上かなり重要です。 開発中に「これは答えられません」と言われて作業が止まる、 そういったストレスが減ることを期待しています。 少し試してみた段階ですが、確かに「考えてから動く」感覚があります。 以前のモデルはすぐにコードを書き始めることが多かったのに対し、 Opus 4.6は一度立ち止まって全体を見渡してから作業を始める印象です。 Anthropic社内でも「タスクの難しい部分に自発的に注力し、 簡単な部分はさっと進める」という評価があるようですが、 まさにそういう挙動を感じました。 Agent Teamsについてはまだ本格的に試せていませんが、 これからの開発で積極的に使ってみようと思います。 特にRakutenの事例が印象的で、 「1日で13件のissueを自律クローズし、12件を適切なチームメンバーにアサインした。 約50人の組織で6つのリポジトリを横断して運用・組織判断を行い、 人間にエスカレーションすべきタイミングも判断できた」と報告されています。 これが本当なら、開発チームの働き方が大きく変わりそうです。Table of Contents
コーディング能力の大幅強化
100万トークンのコンテキスト対応
Adaptive ThinkingとEffort制御
/effort mediumで調整できるのも実用的です。Context Compaction
Agent Teams
Officeツール連携
安全性
私のファーストインプレッション
パートナー企業の評価
参考資料