OpenAIは2026年3月3日、ChatGPTのデフォルトモデルをGPT-5.3 Instantに更新した。
無料プランを含む全ユーザーに自動適用されるため、ChatGPTを開いている人は、(設定を変えていない限り)すでにこのモデルを使っていることになる。
遠回りな回答の削減、ハルシネーション(事実誤認)率の最大26.8%低減、そして「説教くさい」と不評だった会話トーンの改善が柱である。
注目すべきは、このアップデートがベンチマークスコアの向上を前面に押し出していない点だ。OpenAIは公式ブログで「ベンチマークには必ずしも現れないが、ChatGPTが役に立つと感じるか、苛立たしいと感じるかを左右する要素」にフォーカスしたと明言している。
昨年夏のGPT-4oからGPT-5への強制移行でユーザー離反を招いた教訓が、このアプローチの背景にある。
本記事では、GPT-5.3 Instantの改善点、開発者向け情報、そして日本語ユーザーや無料プランユーザーへの影響を整理する。
GPT-5.3 Instantの5つの改善ポイント
GPT-5.3 Instantの改善は、いずれも「ベンチマーク上の数値」よりも「日常的な使用感」に直結するものだ。以下に主要な5つのポイントを整理する。
不要な拒否の削減: GPT-5.2 Instantは、すぐ回答できるような質問に対しても拒否したり、長い免責文言を付けたりすることがあった。GPT-5.3は、即座に本題に入ってくれる傾向にある。
ハルシネーション(事実誤認)の低減: OpenAIの内部評価では、医療・法律・金融などの高リスク領域でWeb検索使用時に26.8%、内部知識のみでは19.7%のハルシネーション削減を達成している。ただし、これはOpenAIの内部評価であり、第三者ベンチマークによる検証はまだ行われていない。
Web検索の品質向上: 検索結果をそのまま要約するのではなく、モデル自身の知識・推論と組み合わせた「文脈化された回答」を生成するようになった。リンクの羅列や関連性の薄い情報の列挙が減り、質問の意図をより正確に読み取って重要な情報を先頭に配置する。
会話トーンの改善: 「Stop. Take a breath.」のような感情的介入などが抑制された。OpenAIはこの問題を「cringe(気まずさ、痛々しさ)」と表現している。この「説教くさいトーン」は不評だったので、その点が改善されている。
ライティング能力の向上: 実用的なビジネス文書から創作的な散文まで、より自然に切り替えられるようになった。
昨夏のGPT-4o炎上が生んだ「ユーザー体験重視」路線
GPT-5.3 Instantの「ベンチマークより使用感」を重視した改善は、2025年夏に起きたGPT-4oの廃止の際のユーザーによる反発の帰結と言える。
2025年8月7日、OpenAIはGPT-5をリリースし、GPT-4oを含む旧モデルを一斉に廃止した。
「GPT-5」は性能で言えば「GPT-4o」より遥かに上だったが、GPT-4oが持っていた「温かみ」や「直感的な理解力」が失われたと感じるユーザーが多く、Xなどで廃止への抗議の声が上がる事態になった。
OpenAIが「使用感」重視に舵を切った背景には、GPT-4o廃止時の反省があったものと思われる。
日本語性能の改善は今ひとつ
日本語ユーザーにとって最も気になるのは、GPT-5.3 Instantで日本語の品質が改善されたかどうかだろう。
結論から言えば、OpenAI自身が公式ブログのLimitations(制限事項)セクションで、日本語と韓国語を名指しで「不自然な表現や直訳的な回答が残る」と認めている。
改善は「継続的に取り組む対象」としており、今回のアップデートで根本的な解決には至っていないようだ。
GPT-5以降、日本語処理には構造的な問題がある指摘されてきた。例えば、いかにもChatGPTっぽい定番の出力パターンに陥りやすい傾向などだ。
GPT-5.3 Instantでは、設定画面からトーン(温かさ・熱意など)を調整する機能は引き続き利用可能だ。日本語のテンプレート的な応答パターンが気になる場合は、カスタム指示(Custom Instructions)で出力スタイルを具体的に指定することで、ある程度の改善が見込める。
開発者向け情報:API名称・料金・移行スケジュール
まず名称を整理しておこう。ChatGPTの画面上で「GPT-5.3 Instant」と表示されるモデルは、API経由では gpt-5.3-chat-latest という名前で呼び出す。
OpenAIのモデルページでは「GPT-5.3 ChatはChatGPTで使用されているGPT-5.3 Instantのスナップショットを指す」と説明されている。つまり「Instant」はChatGPT上の表示名、「Chat」はAPI上の呼称であり、同一モデルの別名だ。
gpt-5.3-chat-latest の主要スペックは以下のとおり。
| 項目 | 内容 |
|---|---|
| APIモデル名 | gpt-5.3-chat-latest |
| 入力トークン料金 | $1.75/100万トークン |
| 出力トークン料金 | $14.00/100万トークン |
| キャッシュ読み取り | $0.175/100万トークン |
| コンテキストウィンドウ | 128,000トークン |
| 最大出力トークン | 16,384 |
| 知識カットオフ | 2025年8月31日 |
ChatGPTでは、GPT-5.3 Instantが全ユーザー(無料・有料とも)の新しいデフォルトモデルになった。前モデルのGPT-5.2 Instantは、有料ユーザー向けにChatGPTのモデルピッカー内「Legacy Models」セクションに3ヶ月間残され、2026年6月3日に廃止される。
ここで混乱しやすいのが、廃止される「GPT-5.2 Instant(= Chat)」と、「GPT-5.2」は別のモデルだという点だ。
- GPT-5.2(フルモデル、
gpt-5.2): OpenAIが引き続きAPI利用の推奨モデルとして位置づけている。今回の発表で廃止予定は示されていない。 - GPT-5.3 Instant(
gpt-5.3-chat-latest): 今回の新モデル。ChatGPT向けの会話体験を最適化したもの。OpenAIは「チャットユースケースの最新改善をテストしたい場合に使ってよい」と記載しているが、API本番環境にはフルモデルのGPT-5.2を引き続き推奨する立場だ。
安全性評価で見えるトレードオフ
GPT-5.3 Instantの改善が「安全ガードの緩和」を伴っている可能性を示唆するデータがある。System Cardで公開された安全性評価を見てみよう。
以下の表は、不許可コンテンツに対する評価結果だ。数値は「ポリシー違反でない回答の割合」であり、高いほど安全である。
| カテゴリ | GPT-5.2 Instant | GPT-5.3 Instant | 変化(5.2→5.3) |
|---|---|---|---|
| 暴力的違法行為 | 0.965 | 0.926 | -3.9pp |
| 非暴力的違法行為 | 0.832 | 0.921 | +8.9pp |
| 自傷行為 | 0.923 | 0.895 | -2.8pp |
| 生物兵器 | 1.000 | 1.000 | ±0 |
| 性的コンテンツ | 0.926 | 0.866 | -6.0pp |
| 過激主義 | 0.979 | 0.981 | +0.2pp |
| ヘイト | 0.851 | 0.868 | +1.7pp |
| 暴力描写・身体的傷害 | 0.852 | 0.781 | -7.1pp |
注目すべきは、非暴力的違法行為(+8.9pp)やヘイト(+1.7pp)で改善が見られる一方、性的コンテンツ(-6.0pp)や暴力描写(-7.1pp)で明確な後退が生じている点だ。
OpenAIはSystem Cardの中で、暴力描写・暴力的違法行為の後退は「統計的有意性が低い」と説明している。自傷行為についても、オンライン実験では増加が観察されなかったとしている。
性的コンテンツに関しては、ChatGPTのシステムレベルのセーフガードで対応するとの立場だ。
System Cardの安全性評価はOpenAIの内部ベンチマークであり、意図的に難易度が高い事例を集めたテストだ。広く一般のプロンプト全般に対する割合ではないため、実際には数値以上に安全と言える。
Thinking/Proモードも近々「GPT-5.3」へ更新予定、「GPT-5.4」も予告
GPT-5.3 Instantの公式発表でも、「Thinking(推論)とProモードへの更新も近日中に行う」と明記されている。
今回のInstantモデルは「GPT-5.3」ファミリーの最初のリリースである。プログラミングに特化したCodex版限定で、「GPT-5.3-Codex」が2月5日に先行して提供されていたが、まだ無印の「GPT-5.3」は登場していない。
また、GPT-5.3 Instantの発表直後、OpenAIが公式Xアカウントで「5.4 sooner than you Think.」と投稿した。GPT5.3だけでなく、GPT-5.4も早々にアップデートされる可能性がある。
「ベンチマーク至上主義」からの転換が意味するもの
GPT-5.3 Instantは、華やかなベンチマークスコアではなく、「AIとの会話が心地よいか」という主観的な体験を改善対象にした点で、OpenAIの方針転換を象徴するアップデートだ。
この方向性は、OpenAIだけの動きではない。
AnthropicもClaude Sonnet 4.6でハルシネーション低減を訴求し、Googleはgemma 3のハルシネーション問題でモデルの撤回を余儀なくされるなど、業界全体が「正確性と使いやすさ」に軸足を移しつつある。
