2026年6月30日、Anthropic が Claude Sonnet 5 を発表しました。@claudeai の投稿では「これまでで最もエージェント向きの Sonnet」と位置づけられ、計画立案・ブラウザやターミナルなどのツール利用・自律実行が、数か月前にはより大きく高価なモデルが必要だったレベルまで到達した、と説明されています。
開発者向けの @ClaudeDevs では、コーディングとツール利用でトップクラスの性能を Sonnet 価格帯で提供し、100万トークンのコンテキストウィンドウを備えると紹介されています。Claude Code の Pro ユーザー向けデフォルトモデルにもなり、Claude Platform・API・Managed Agents から利用可能です。
Sonnet 4.6 からの位置づけ
@claudeai の続報 では、Sonnet 5 は推論・ツール利用・コーディング・ナレッジワークの各面で Sonnet 4.6 から大きく改善し、Opus 4.8 に近い性能をより低い価格で提供する、と述べられています。
| 項目 | 内容 |
|---|---|
| 前モデル | Claude Sonnet 4.6(2026年2月) |
| 性能の目安 | Opus 4.8 に近い |
| 強み | エージェント、コーディング、ツール利用 |
| コンテキスト | 100万トークン(@ClaudeDevs) |
「大きいモデルでないと無理だった自律タスクが、Sonnet クラスで回せるようになった」——というのが、今回の発表の核だと受け取りました。
どこで使えるか
公式ページ によると、利用先は次のとおりです。
- Claude.ai(Web / iOS / Android)— Free・Pro のデフォルトモデル
- Max / Team / Enterprise プラン
- Claude API — モデル ID は
claude-sonnet-5 - Claude Platform(Managed Agents 含む)
- AWS / Google Cloud / Microsoft Foundry
- Claude Code — Pro ユーザーのデフォルト
- Devin — Desktop と CLI で Sonnet 5 を選択可能(Cognition の告知)
エージェント基盤(Flue など)で anthropic/claude-sonnet-5 のように指定する流れも、そのまま使えそうです。
Devin 側の対応
Cognition(Devin)も同日、Sonnet 5 の利用開始を X で告知 しています。
- Devin Desktop と Devin CLI で Claude Sonnet 5 が選べる
- フロンティア級のコーディング性能を、より手の届く価格帯で使える
- FrontierCode Extended で Opus 4.8 を上回る、と Cognition は述べている
FrontierCode Extended とは(補足)
FrontierCode は Cognition(Devin)が公開したコーディングベンチマークです。SWE-bench のように「テストが通るか」を見るのではなく、シニアメンテナがその PR を実際にマージするか を評価します。正しさに加え、テストの質・変更範囲・スタイル・コードベースの規約といった「本番で受け入れられるか」まで含めたスコアです。
タスクは全部で 150 問あり、難易度ごとに入れ子のサブセットに分かれています。
| サブセット | タスク数 | 意味 |
|---|---|---|
| Extended | 150(全部) | フルセットの性能スコア |
| Main | 100 | Extended のうち難しい方 |
| Diamond | 50 | 最難関 |
FrontierCode Extended は、この 150 問すべてを使ったスコアのことです。「Extended で Opus 4.8 を上回った」とは、フルセットでの総合性能が前フラッグシップを超えた、という読み方になります。発表時点の Cognition のブログ では、Opus 4.8 は Extended で 51.8%——半分弱しか「マージされる品質」に届かない、という厳しさも示されていました。
ベンチマーク自体は Cognition 独自なので第三者検証ではありませんが、Devin が重視する「マージ可能なコード」を軸にした比較としては、Sonnet 5 のコーディング性能を示す根拠になっています。
Devin はモデルを差し替え可能なエージェント製品なので、Anthropic 本体の発表とセットで「エージェント側もすぐ Sonnet 5 に乗れる」流れになっています。000084 で触れた Devin のトリアージ用途とも、モデル更新のニュースとしてはつながりやすいです。
価格(API)
公式の価格情報 では、API は次のとおりです。
| 期間 | 入力 | 出力 |
|---|---|---|
| 〜2026年8月31日(紹介価格) | $2 / 100万トークン | $10 / 100万トークン |
| 以降(標準価格) | $3 / 100万トークン | $15 / 100万トークン |
参考として、Opus 4.8 は $5 / $25(VentureBeat の報道)とされており、Sonnet 5 はフラッグシップより安い帯域に置かれています。プロンプトキャッシュ(最大90%削減)やバッチ処理(50%削減)も利用可能です。
エージェント用途で強調されている点
公式ページでは、Sonnet 5 の用途として次が挙げられています。
- Advanced coding — 計画から実装・デバッグ・大規模リファクタまで
- Long-running agents — 指示追従、ツール選択、エラー修正を伴う自律ワークフロー
- Browser and computer use — ブラウザベースの業務自動化
- Enterprise workflows — 調査、文書生成、業務オペレーション
X 投稿の「ブラウザやターミナルを使い、計画を立てて自律実行する」と、ここは一致しています。数か月前は Opus クラスが必要だった作業が、Sonnet の速度と価格帯に降りてきた、というメッセージです。
所感
先日書いた Flue の読書メモ でも触れたように、エージェントの本番化はフレームワーク側の話と、モデル側の「ツールをどこまで自律的に使えるか」の話がセットで進んでいます。Sonnet 5 は後者の更新で、エージェントのデフォルト候補が一段上がった印象です。
Claude Code の Pro デフォルトが Sonnet 5 になる点は、日常のコーディングエージェント利用にもすぐ効きます。Devin Desktop / CLI でも同日から選べるようになっており、Cognition は FrontierCode Extended で Opus 4.8 を上回ったと述べています。API 利用者は claude-sonnet-5 と紹介価格の期限(2026年8月31日)を押さえておくとよさそうです。