ニュース
「Claude Sonnet 5」公開 Opus 4.8に迫る性能でコストを抑制
2026年7月1日 10:23
Anthropicは30日(米国時間)、自律性を向上した最新AIモデル「Claude Sonnet 5」を提供開始した。無料を含む全てのClaudeプランで利用可能で、FreeとProではデフォルトモデルとなる。また、Claude CodeやPlatformでも利用できる。コストは、入力トークン100万トークンあたり3ドル、出力が15ドル。
Claudeではコストが安い順に、Haiku、Sonnet、OpusとFable 5(公開停止中)の4シリーズのモデルを用意しているが、Claudeの中核的なモデルとなるSonnetが刷新された。Sonnet 5は、これまでで最も自律性の高いSonnetモデルとなり、ブラウザやターミナルなどのツール使用や、自律的な動作の性能を向上。上位モデルのOpus 4.8に迫る自律性を持ちながらコストを抑えており、推論、ツールの使用、コーディング、知識作業といったエージェント性能において、前世代のSonnet 4.6から大幅に改善した。
ベンチマークにおいては、Sonnet 5のエージェントコーディング(SWE-bench Pro)が63.2%で、Sonnet 4.6(58.1%)を上回り、Opus 4.8(69.2%)に迫る。Terminal Bench 2.1では、Sonnet 5が80.4%でSonnet 4.6の67%を超え、Opus 4.8の82.4%に迫る。
Computer Use(OSWorld-Verified)は、Sonnet 5が81.2%で、Sonnet 4.6が78.5%、Opus 4.8が83.4%、ナレッジワーク(GDPval-AA v2)はSonnet 5が1,618、Sonnet 4.6が1,395、Opus 4.8が1,615で、Opusを超えている。
全体としてSonnet 5は Sonnet 4.6との比較で確実に性能が向上。加えてOpus 4.8よりも高いコストパフォーマンスを示しており、中程度のエフォート(努力)レベルではコスト効率が大幅に向上。高エフォートレベルでの性能は、一部のタスクでOpus 4.8に匹敵する。ユーザーはエフォートレベルを調整することで、コストと性能の適切なバランスを見つけられるとしている。
また、同社の安全性評価では、Sonnet 5はSonnet 4.6に比べて望ましくない行動の発生率が全体的に低く、エージェントとしての文脈でより安全に使用できると説明。サイバーセキュリティタスクを実行する能力も、現行Opusモデルに比べてはるかに低いとしているなど、高いサイバー能力を持つFable 5/Mythosが米国政府から公開停止命令を受けたことに配慮して、公開していることがうかがえる。
Sonnet 5はすべてのClaudeプランとAPIで利用可能で、APIのモデル名は「claude-sonnet-5」。コストは、入力トークン100万トークンあたり3ドル、出力が15ドルだが、8月31日まで100万トークンあたり入力2ドル、出力10ドルとする。




