
米国時間2026年2月5日、AnthropicがClaudeシリーズの最上位モデル「Claude Opus 4.6」をリリースした。
Opus 4.6は、前モデルのOpus 4.5からコーディング能力やエージェント性能を大幅に強化しているほか、Opusクラスとして初めて100万トークンのコンテキストウィンドウに対応した。
価格は据え置きで、すでにclaude.aiやAPIで利用可能となっている。
興味深いことに、OpenAIも同日にGPT-5.3-Codexをリリースしており、両社の最新コーディング特化モデルが15分差で発表されるという異例の事態となった。フロンティアモデル同士の競争が激化している証左といえる。
本記事では、Opus 4.6の主要な改善点と新機能を速報的に整理する。
Opus 4.6 の概要:Opus 4.5からの主な改善点
100万トークンのコンテキストウィンドウ
Opus 4.6は、Opusクラスとして初めて100万(1M)トークンのコンテキストウィンドウに対応した(ベータ機能)。
長いドキュメントやコードベースを扱う際に発生しがちな「context rot」(文脈の劣化)問題が大幅に改善されている。
Anthropicによれば、長文コンテキスト検索の正確さを測るMRCR v2ベンチマークにおいて、Opus 4.6は76%のスコアを記録。Sonnet 4.5の18.5%と比較して、圧倒的な長文処理能力を示している。
出力トークン上限も128kまで拡大され、大規模なコード生成やドキュメント作成がより実用的になった。
Opus 4.6 の主要ベンチマーク結果
主要なベンチマークにおけるOpus 4.6の成績は以下の通り。
| ベンチマーク | Opus 4.6 スコア | 備考 |
|---|---|---|
| Terminal-Bench 2.0 | 65.4% | 首位(max effort時) |
| Humanity’s Last Exam | 首位 | 複雑な多分野推論テスト |
| GDPval-AA | GPT-5.2を144 Elo上回る | 経済価値のある知識労働タスク評価 |
| BrowseComp | 86.8%(multi-agent時) | 情報探索能力 |
| MRCR v2 (1M, 8-needle) | 76% | 長文コンテキスト検索 |
| BigLaw Bench | 90.2% | 法律推論(40%が満点) |
| ARC AGI 2 | 68.8% | 抽象的推論 |
| SWE-bench Verified | 78%+ | ソフトウェアエンジニアリング |
特筆すべきは、GDPval-AA(経済価値のある知識労働タスク評価)でGPT-5.2を144 Eloポイント上回り、前モデルのOpus 4.5からも190ポイント改善している点だ。
金融・法務などのエンタープライズ領域での実用性が高まっている。
コーディング能力の大幅強化
Opus 4.6は、コーディングタスクにおいて以下の改善が見られる。
- より慎重な計画立案
- 長時間のエージェントタスクの持続
- 大規模コードベースでの信頼性向上
- コードレビュー・デバッグ能力の向上(自身のミスを発見できる)
ちなみに、記事執筆現在のTerminal-Bench 2.0(エージェント型コーディング評価)のリーダーボードを確認すると、Opus 4.6 は 69.9% 、ほぼ同時に登場したGPT-5.3-Codexが 75.1% で首位となっている。

推論制御の新機能:Adaptive ThinkingとEffort

API利用者向けに、推論の深さを制御する新機能が追加された。
- Adaptive Thinking: 文脈に応じて拡張思考(extended thinking)の深さを自動調整
- Effort制御: low / medium / high(デフォルト)/ max の4段階で開発者が調整可能
従来は拡張思考のオン/オフしか選べなかったが、タスクの複雑さに応じて柔軟にコントロールできるようになった。
シンプルなタスクではmediumに下げてスピードを向上させ、難問ではmaxに上げて精度を高める、といった使い分けが可能だ。
また、Context Compaction(ベータ機能)により、長時間の会話やエージェントタスクでコンテキストウィンドウの上限に達しそうになった際、古い文脈を自動要約して圧縮できるようになった。
パワポへのClaude組み込みなど周辺ツールも強化
Claude in PowerPoint

Officeツールとの統合が拡大し、PowerPointへの対応が新たに追加された(Research Preview)。
Claude in PowerPointでは、スライドのレイアウト、フォント、スライドマスターをClaudeが読み取り、ブランドに沿ったスライド作成が可能になる。説明文から完全なプレゼンテーションデッキを生成することもできる。
Max、Team、Enterpriseプランで利用可能だ。
Claude in Excelの強化

既存のClaude in Excelも大幅に強化された。
- 長時間・複雑なタスク処理の改善
- 行動前の計画立案
- 非構造化データの取り込みと構造推論
- マルチステップの変更を一度に実行
ExcelとPowerPointを組み合わせることで、Excelでデータを処理・構造化し、PowerPointで視覚化するという一連のワークフローをClaudeに任せられるようになる。
Agent Teams(Claude Code)
Claude Codeに、複数のエージェントを並列で起動して協調作業させる「Agent Teams」機能が追加された(Research Preview)。
独立性の高いタスク、たとえばコードベース全体のレビューなどに最適とされている。各エージェントはそれぞれ独立してタスクを担当しつつ、自律的に協調する。ユーザーはShift+Up/Downやtmuxを使って、任意のサブエージェントを直接操作することも可能だ。
Anthropicのエンジニアであるニコラス・カリーニ氏は、Agent Teamsを使って並列のClaudeチームでCコンパイラを構築した事例を紹介しており、複雑なプロジェクトでの実用性が示されている。
Opus 4.6 を実際に試す方法&API価格
利用可能なプラットフォーム

Opus 4.6は以下のプラットフォームで利用可能だ。
- claude.ai: すぐに利用可能(Pro / Max / Team / Enterprise)
- Claude API: モデルID
claude-opus-4-6を指定 - Claude Code: Agent Teams機能とともに利用可能
- AWS Bedrock: Amazon Bedrockで提供開始
- Google Cloud Vertex AI: Vertex AIで提供開始
- Microsoft Foundry: Azure上のMicrosoft Foundryで提供開始
Opus 4.6 のAPI価格:4.5と据え置き
API価格はOpus 4.5と据え置きで、$5 / $25 per million tokens(入力/出力)。
ただし、200kトークンを超えるプロンプトにはプレミアム価格($10 / $37.50 per million tokens)が適用される。US-only推論を選択した場合は1.1倍の価格となる。
OpenAI Codex 5.3との同時リリースについて
冒頭でも触れたように、OpenAIのGPT-5.3-Codexとほぼ同時にリリースされたことは業界で大きな話題となっている。
両モデルともコーディング特化のフロンティアモデルであり、「AIコーディング戦争」とも報じられている。筆者の見解では、これはAIモデル開発競争がコーディング・エージェント領域で特に激化していることの表れだろう。
ただし、Codex 5.3は現時点ではCodexアプリ経由のみでの提供であり、APIでは利用できない。一方、Opus 4.6はAPIを含む複数のプラットフォームで即座に利用可能という点で、開発者にとっての導入ハードルは低い。
まとめ
Claude Opus 4.6は、コーディング能力、長文処理能力、エージェント性能のすべてにおいて大幅な進化を遂げたモデルだ。
特に注目すべきポイントは以下の3点である。
- 100万トークンのコンテキストウィンドウ: Opus初。大規模コードベースや長文ドキュメントの処理が実用的に
- Agent Teams: 複数エージェントの並列協調作業が可能に
- Claude in PowerPoint: Officeツール統合の拡大、ビジネスユースケースの強化
価格は据え置きでclaude.aiやAPIからすぐに利用可能なので、興味のある方はぜひ試してみてほしい。
