
2025年12月11日、OpenAIが最新のフロンティアモデル「GPT-5.2」シリーズをリリースした。早速、ChatGPTやAPIでモデルとして選択可能になっている。
11月に登場したGoogleの超高性能な最新モデル「Gemini 3 Pro」の猛追を受け、OpenAI内部で「コード・レッド(緊急事態)」が宣言されたとも噂される中で投入されたのが、今回の「GPT-5.2」である。
OpenAIのGPT-5.2の公式リリースでは、「プロフェッショナルな知識労働のための最も有能なモデル」と表現されている。
GPT-5.2は、前世代と比べ全体的にベンチマーク性能が向上しているが、中でも「GDPval」という44の職業の知識労働を模したベンチマークでは、人間の専門家を超えるパフォーマンスを示しているという。
複雑な経済モデルをエクセルで構築したり、実用レベルのパワポスライドを生成したりと、単なるチャット相手を超えて、真に「実務で使える」レベルに到達しつつある。
本記事では、そんな登場したばかりの「GPT-5.2」について、その衝撃的な性能、3つのモデルの解説、そして実際に使ってみて分かったスライド作成や表計算など「実務での活用法」まで、徹底解説していく。
GPT-5.2 の概要:2025年8月までの知識&人間を超えた「仕事力」
GPT-5.2は、モデルが事前学習している知識のカットオフ時点が、今年の2025年8月と、かなり新しい。前世代のGPT-5.1はカットオフが2024年9月だったので、ずっと新しいトピックについて会話できるようになった。
GPT-5.2の最大の特徴は、「GDPval」と呼ばれる経済的価値のあるタスク(プレゼン作成、スプレッドシート構築、スケジュール管理など)におけるスコアの高さだ。
以下のグラフは、GPT-5.2と過去のモデル(GPT-5、GPT-5.1)の性能を比較したものだ。

GDPvalは、米国のGDPに貢献する9産業の44職種から、「売上予測のExcelを作って」「来期の採用計画スライドを作って」といった、複雑な実務タスクをモデルに実行させるものだ。
縦軸はその業界のプロフェッショナル(人間)への勝率・引き分け率を示している。これが50%を超えていれば、各業界の専門家と五分五分以上で戦えることを意味するので、「専門家を超える知能」と評価できる。
「GPT-5.2 Thinking」は、これが70.9%にも達しており、各業界の専門家以上のパフォーマンスを発揮していることになる。
実務タスクの種類によっては、各業界のベテランスタッフや、経営コンサルタントが行うような複雑な業務において、人間のエキスパートと同等かそれ以上の成果物を、圧倒的なスピードで出力できるのだ。
他にも、OpenAIは「コーディング」「長文理解」「画像理解」「ツール利用」「数学・科学」などで、広範にSOTA(最先端)更新を主張している。
注目すべき各種ベンチマークのポイントは以下などが挙げられる。
- 推論能力全般の向上:「ARC-AGI-2(Verified)」でGPT-5.2 Thinking が 52.9%、Pro が 54.2%で、GPT-5.1 Thinkingの17.6%を圧倒。
- コーディング能力の向上:ソフトウェア問題解決力を測るSWE-Bench Proベンチマークで「GPT-5.2 Thinking (xhigh)」が55.6%と、「GPT-5.1-Codex-Max (xhigh)」の52%を上回る。
- エージェント性能の向上:複数のツールを使いこなす能力が飛躍的に向上。「フライトの再予約をしつつ、ホテルを手配し、補償を申請する」といったマルチステップのタスク完遂率が98.7%に達した。
- ハルシネーション(嘘)の低減:GPT-5.1と比較して、誤った情報を出力する頻度が約30%減少している。
- 長文脈の理解:数百ページのドキュメントを読み込ませても、情報の欠落がほぼゼロ(MRCRv2ベンチマークで近接100%)。
3つの新モデル:Instant, Thinking, Pro の違いと利用料金

ChatGPT上では、ユーザーの用途に合わせて以下の3つのモードが展開される。
但し、「GPT-5.2 Pro」は、最も高額なProプランに登録していなければ利用できないので、月額20ドルのPlusプランのユーザーは利用することができない。
| モデル名 | 特徴 | おすすめの用途 |
|---|---|---|
| GPT-5.2 Instant | 高速・軽量。GPT-5.1 Instantより説明が明確で親しみやすい。 | 日常のメール作成、翻訳、簡単な調べ物。 |
| GPT-5.2 Thinking | 今回の主力。 思考プロセス(CoT)を経て回答する。コーディングや複雑な推論に強い。 | プログラミング、長文要約、数学、複雑な計画策定。 |
| GPT-5.2 Pro | 最上位モデル。応答に時間はかかるが、最高精度を誇る。 | 非常に難解なプログラミングのバグ特定、論文の査読、ミスが許されない業務。 |
思考モード(Thinking)は、回答の生成に時間はかかるものの、モデルが持つ性能を最大限に引き出すことができる。もし普段ChatGPTで思考モードを利用していない人がいれば、ぜひThinkingモデルに切り替えてみて、その性能の違いを体感してみてほしい。
なお、開発者が気になるAPIでの利用価格は、新世代モデルにしては珍しく、価格が上昇している。
GPT-5.1と比較して、GPT-5.2は約1.4倍高い、という価格設定となっている。
| APIモデル名 | 1M入力トークン | 1M出力トークン | 備考 |
|---|---|---|---|
| gpt-5.2 | $1.75 | $14.00 | Thinkingモデル相当。キャッシュ時は90%OFF。 |
| gpt-5.2-pro | $21.00〜 | $168.00〜 | 超高額。最高品質が必要なタスク専用。 |
| gpt-5.1 (参考) | $1.25 | $10.00 | 一世代前 |
実務直結の強化ポイントを試す:資料作成が「下書き」レベルを超えた
これまでのAIモデルも、「表」や「箇条書き」を作ることはできたが、あくまで「テキストベース」であり、それを人間がExcelやPowerPointにコピペして体裁を整える必要があった。
しかし、GPT-5.2(特にThinkingモデル)は、「そのまま使えるレベル」の成果物が出てくる性能に到達しつつある。OpenAIの公式リリースでも、デザイン性の高いパワポスライドやエクセルの金融モデルを生成する性能が強調されている。
ここでは、現実にありそうなビジネスタスクをGPT-5.2に与えてみて、どれくらいイケている資料を作ってくれるか、実際に試してみる。
1. 投資銀行レベルの「完全なスプレッドシート」の生成
GPT-5.2は、単にCSV形式でデータを出力するだけではない。数式、セルの書式設定、複数シートの連携を含んだ、複雑なExcelファイル(.xlsx)を直接生成する能力が向上している。
OpenAIの公式リリースでは、Fortune 500企業の3つの財務諸表モデルを作成する、スタートアップの資本政策表を作る、といったプロンプトの例が紹介されている。
簡単に性能を確認するため、実際に、以下のようなプロジェクト管理用のガントチャートを生成させてみた。
システム開発プロジェクトの「進捗管理ガントチャート」のExcelファイルを作成してください。
**シート1: タスク一覧**
* タスク名(要件定義、設計、実装A、実装B、テスト、リリースなど)
* 担当者名
* 開始日(2025/1/10起算で依存関係を持たせる)
* 終了日(開始日 + 工数で自動計算する数式を入れること)
* 進捗率(0%〜100%)
**シート2: ガントチャート**
* 横軸にカレンダー(1日1列)を並べる。
* 条件付き書式を使い、シート1の期間に該当するセルを自動で「青色」に塗りつぶす数式を仕込んでください。
* 進捗率100%のタスクは「グレー」になるようにしてください。
**デザイン**
* 罫線を引き、非常に見やすくプロフェッショナルな見た目にすること。
生成にかかった時間は2分ほどで、そのままChatGPTの画面から完成したExcelファイルをダウンロードすることが可能だ。

以下が実際に生成されたエクセルファイルを開いた状態だ。
見栄えの良いデザイン、シート間参照、セルへの数式入力、また条件付き書式によるセルの色分けまで、手作業で作るとそこそこ面倒なExcelファイルが、一発で生成されていることが分かる。

2. 「Nano Banana Pro」より実用的!コンサル品質の「スライド・プレゼン」構築
プレゼンテーション作成においても、「スライドの構成案」を出す段階から、「スライドそのもの」を作る段階へと進化している。
特に、GPT-5.2は、タイトルと箇条書きだけでなく、情報をどのように配置すれば伝わるかという「デザイン的思考」が強化されているという。
こちらも、実際に以下のプロンプトでスライドの生成を頼んでみた。
あなたは優秀なプロダクトマネージャーです。
新製品であるエンジニア向けAIスマートグラス「VisionFlow」の社内承認用プレゼンテーション資料(PowerPoint形式 .pptx)を作成してください。
### 製品概要(架空)
* 製品名:VisionFlow(ビジョンフロー)
* ターゲット:集中力を高めたいプログラマー、エンジニア
* 主要機能:視界の隅にAPIドキュメントを表示、集中力を阻害する通知のブロック、ポモドーロタイマー内蔵
### スライド構成(全5枚)
1. **タイトルスライド**: インパクトのあるキャッチコピーと製品名
2. **課題と解決策**: エンジニアが抱える「集中力断絶」の課題と、それをどう解決するか
3. **ターゲットペルソナ**: 具体的なユーザー像(名前、年齢、悩み)
4. **ロードマップ**: 開発から発売までの3ヶ月間のスケジュール(矢印や図形を使って表現してください)
5. **販売戦略と価格**: サブスクリプションモデルの価格表
### デザイン要件
* **Pythonの `python-pptx` ライブラリを使用して、実際に .pptx ファイルを生成してください。**
* 背景は白、アクセントカラーは「テックブルー(濃い青)」を使用してください。
* 単なる箇条書きだけでなく、Slide 4のロードマップや Slide 5の価格表は、図形や表を使って視覚的にわかりやすく配置してください。
* 各スライドに、プレゼンター用の「ノート」も追記してください。
実際に生成されたのが以下のスライドである。テキストボックスや、図形を組み合わせたイラストなど、かなりデザイン面でも頑張っていることが感じられる。
以前のモデルであれば、単なる箇条書きレベルのスライドが出てくるだけで結局大量の手直しが必要だったが、GPT-5.2で生成されるスライドは、本当に実務でそのまま使えるレベルに到達しているといって過言ではないだろう。
日本語も問題なく生成できているので、スライドの構成メモを作ったら、あとはChatGPTに「スライド化してください」と投げておくだけで、報告資料が完成してしまう場面もありそうだ。

ガントチャートなど複雑な図形は、若干テキストが重なってしまうなどの修正ポイントはあるものの、AIが生成するスライドとしての完成度はかなり高い方に思える。

ちなみに、最近はGoogleの画像生成AIである「Nano Banana Pro」でのスライド画像の生成も注目されているので、同じプロンプトで生成させてみた。
「Nano Banana Pro」の方が、イラストを交えて視覚的にはキャッチーだが、「GPT-5.2」のスライドの方が、テキストも後から編集可能であるし、現実社会では実用的ではないだろうか?


ChatGPTは「話し相手」から「手を動かすパートナー」へ
GPT-5.2は、なんでも知ってる便利なチャットAIというよりは、本格的に「仕事を任せるためのAI」へと成長しつつある。
今回、GPT-5.2(特にThinkingモデル)を検証して痛感したのは、これまでの「AIとテキストでチャットする」という感覚から、面倒なパワポ作り・エクセル作りなど「部下や同僚によくある作業を依頼する」感覚へと移行した、ということだ。
今回作成したExcelのガントチャートやPowerPointスライドのように、GPT-5.2は人間がそのまま提出できるレベルの「成果物」を直接生み出せるようになりつつある。
コンサルタントやアナリストが数時間かける仕事を数分で完遂できると考えれば、そのROI(費用対効果)は計り知れない。
まずはChatGPT Plusなど有料プランに変えて「Thinking」モードを利用可能にした上で、面倒な資料作成をGPT-5.2に頼んでみることを勧める。
