ニュース

Claude最上位モデル「Opus 4.5」 コーディング・エージェント強化

SWEベンチの結果

Anthropicは11月25日、最新の大規模言語モデル「Claude Opus 4.5」の提供を開始した。従来モデルに比べ、コード生成やエージェントタスク、コンピューター操作(computer use)、スプレッドシートやプレゼン資料の作成といった複雑な業務処理において性能が大幅に向上した新世代モデル。API、Claudeアプリなどで利用できる。Claude APIでは100万トークンあたり5ドル/25ドル。

ソフトウェアエンジニア向けの試験「SWEベンチ」では、Gemini 3.0 ProやGPT-5.1-Codex-Maxを上回るパフォーマンスを記録した。特に多言語対応が進化しており、「SWE-bench Multilingual」ではCやjava、PHP、Rubyなどの8言語中7言語で他のフロンティアモデルを上回る結果を示した。さらに、実世界に即したエージェントタスクを測る「τ2ベンチ」では、柔軟かつ創造的な問題解決を行なう能力が評価された。

SWE-bench Multilingual

Opus 4.5では安全性の強化にも取り組んでおり、モデルを誤誘導して有害な情報を出力させるプロンプトインジェクション攻撃への耐性が向上。

同時に、開発者向けの新機能も強化された。Claude Developer Platformでは、出力の精度と処理速度のバランスを調整できる「Effort Parameter(エフォートパラメーター)」を導入。タスクの内容に応じて、応答の質を高めるか、処理速度とコストを優先するかを選べる機能で、柔軟にモデルの動作を制御できる。また、記憶機能やコンテキスト圧縮の強化により、エージェント型タスクでの処理効率も向上した。

製品アップデートも行なわれ、「Claude Code」は複数のローカルセッションとリモートセッションを並行して実行できるようになったほか、デスクトップアプリもリリースされた。さらに、Chromeの拡張機能「Claude for Chrome」や「Claude for Excel」のベータ版の提供範囲がMax、Team、Enterpriseのすべてのユーザーがアクセス可能になった。

Claude Code on desktop

さらに、MaxおよびTeam Premiumユーザー向けにOpus固有の使用制限を緩和。従来Sonnetで使用していた量と同程度のトークンが利用可能となった。