AIじゃないよ

GPT-5.3 Instant:ChatGPTが静かにアプデ・GPT-4oが遺したものとは

当サイトはアフィリエイト広告を一部掲載しています。

OpenAIは2026年3月3日、ChatGPTのデフォルトモデルをGPT-5.3 Instantに更新した

無料プランを含む全ユーザーに自動適用されるため、ChatGPTを開いている人は、(設定を変えていない限り)すでにこのモデルを使っていることになる。

遠回りな回答の削減、ハルシネーション(事実誤認)率の最大26.8%低減、そして「説教くさい」と不評だった会話トーンの改善が柱である。

注目すべきは、このアップデートがベンチマークスコアの向上を前面に押し出していない点だ。OpenAIは公式ブログで「ベンチマークには必ずしも現れないが、ChatGPTが役に立つと感じるか、苛立たしいと感じるかを左右する要素」にフォーカスしたと明言している

昨年夏のGPT-4oからGPT-5への強制移行でユーザー離反を招いた教訓が、このアプローチの背景にある。

本記事では、GPT-5.3 Instantの改善点、開発者向け情報、そして日本語ユーザーや無料プランユーザーへの影響を整理する。



GPT-5.3 Instantの5つの改善ポイント

GPT-5.3 Instantの改善は、いずれも「ベンチマーク上の数値」よりも「日常的な使用感」に直結するものだ。以下に主要な5つのポイントを整理する。


  • 不要な拒否の削減: GPT-5.2 Instantは、すぐ回答できるような質問に対しても拒否したり、長い免責文言を付けたりすることがあった。GPT-5.3は、即座に本題に入ってくれる傾向にある。



  • ハルシネーション(事実誤認)の低減: OpenAIの内部評価では、医療・法律・金融などの高リスク領域でWeb検索使用時に26.8%、内部知識のみでは19.7%のハルシネーション削減を達成している。ただし、これはOpenAIの内部評価であり、第三者ベンチマークによる検証はまだ行われていない。



  • Web検索の品質向上: 検索結果をそのまま要約するのではなく、モデル自身の知識・推論と組み合わせた「文脈化された回答」を生成するようになった。リンクの羅列や関連性の薄い情報の列挙が減り、質問の意図をより正確に読み取って重要な情報を先頭に配置する。



  • 会話トーンの改善: 「Stop. Take a breath.」のような感情的介入などが抑制された。OpenAIはこの問題を「cringe(気まずさ、痛々しさ)」と表現している。この「説教くさいトーン」は不評だったので、その点が改善されている。



  • ライティング能力の向上: 実用的なビジネス文書から創作的な散文まで、より自然に切り替えられるようになった。


昨夏のGPT-4o炎上が生んだ「ユーザー体験重視」路線

GPT-5.3 Instantの「ベンチマークより使用感」を重視した改善は、2025年夏に起きたGPT-4oの廃止の際のユーザーによる反発の帰結と言える。

2025年8月7日、OpenAIはGPT-5をリリースし、GPT-4oを含む旧モデルを一斉に廃止した。

「GPT-5」は性能で言えば「GPT-4o」より遥かに上だったが、GPT-4oが持っていた「温かみ」や「直感的な理解力」が失われたと感じるユーザーが多く、Xなどで廃止への抗議の声が上がる事態になった。

OpenAIが「使用感」重視に舵を切った背景には、GPT-4o廃止時の反省があったものと思われる。

日本語性能の改善は今ひとつ

日本語ユーザーにとって最も気になるのは、GPT-5.3 Instantで日本語の品質が改善されたかどうかだろう。

結論から言えば、OpenAI自身が公式ブログのLimitations(制限事項)セクションで、日本語と韓国語を名指しで「不自然な表現や直訳的な回答が残る」と認めている

改善は「継続的に取り組む対象」としており、今回のアップデートで根本的な解決には至っていないようだ。

GPT-5以降、日本語処理には構造的な問題がある指摘されてきた。例えば、いかにもChatGPTっぽい定番の出力パターンに陥りやすい傾向などだ。

補足
GPT-5.3 Instantでは、設定画面からトーン(温かさ・熱意など)を調整する機能は引き続き利用可能だ。日本語のテンプレート的な応答パターンが気になる場合は、カスタム指示(Custom Instructions)で出力スタイルを具体的に指定することで、ある程度の改善が見込める。

開発者向け情報:API名称・料金・移行スケジュール

まず名称を整理しておこう。ChatGPTの画面上で「GPT-5.3 Instant」と表示されるモデルは、API経由では gpt-5.3-chat-latest という名前で呼び出す。

OpenAIのモデルページでは「GPT-5.3 ChatはChatGPTで使用されているGPT-5.3 Instantのスナップショットを指す」と説明されている。つまり「Instant」はChatGPT上の表示名、「Chat」はAPI上の呼称であり、同一モデルの別名だ。

gpt-5.3-chat-latest の主要スペックは以下のとおり。

項目内容
APIモデル名gpt-5.3-chat-latest
入力トークン料金$1.75/100万トークン
出力トークン料金$14.00/100万トークン
キャッシュ読み取り$0.175/100万トークン
コンテキストウィンドウ128,000トークン
最大出力トークン16,384
知識カットオフ2025年8月31日

ChatGPTでは、GPT-5.3 Instantが全ユーザー(無料・有料とも)の新しいデフォルトモデルになった。前モデルのGPT-5.2 Instantは、有料ユーザー向けにChatGPTのモデルピッカー内「Legacy Models」セクションに3ヶ月間残され、2026年6月3日に廃止される

ここで混乱しやすいのが、廃止される「GPT-5.2 Instant(= Chat)」と、「GPT-5.2」は別のモデルだという点だ。

  • GPT-5.2(フルモデル、gpt-5.2): OpenAIが引き続きAPI利用の推奨モデルとして位置づけている。今回の発表で廃止予定は示されていない。
  • GPT-5.3 Instant(gpt-5.3-chat-latest: 今回の新モデル。ChatGPT向けの会話体験を最適化したもの。OpenAIは「チャットユースケースの最新改善をテストしたい場合に使ってよい」と記載しているが、API本番環境にはフルモデルのGPT-5.2を引き続き推奨する立場だ。

安全性評価で見えるトレードオフ

GPT-5.3 Instantの改善が「安全ガードの緩和」を伴っている可能性を示唆するデータがある。System Cardで公開された安全性評価を見てみよう。

以下の表は、不許可コンテンツに対する評価結果だ。数値は「ポリシー違反でない回答の割合」であり、高いほど安全である。

カテゴリGPT-5.2 InstantGPT-5.3 Instant変化(5.2→5.3)
暴力的違法行為0.9650.926-3.9pp
非暴力的違法行為0.8320.921+8.9pp
自傷行為0.9230.895-2.8pp
生物兵器1.0001.000±0
性的コンテンツ0.9260.866-6.0pp
過激主義0.9790.981+0.2pp
ヘイト0.8510.868+1.7pp
暴力描写・身体的傷害0.8520.781-7.1pp

注目すべきは、非暴力的違法行為(+8.9pp)やヘイト(+1.7pp)で改善が見られる一方、性的コンテンツ(-6.0pp)や暴力描写(-7.1pp)で明確な後退が生じている点だ。

OpenAIはSystem Cardの中で、暴力描写・暴力的違法行為の後退は「統計的有意性が低い」と説明している。自傷行為についても、オンライン実験では増加が観察されなかったとしている。

性的コンテンツに関しては、ChatGPTのシステムレベルのセーフガードで対応するとの立場だ。

注意
System Cardの安全性評価はOpenAIの内部ベンチマークであり、意図的に難易度が高い事例を集めたテストだ。広く一般のプロンプト全般に対する割合ではないため、実際には数値以上に安全と言える。

Thinking/Proモードも近々「GPT-5.3」へ更新予定、「GPT-5.4」も予告

GPT-5.3 Instantの公式発表でも、「Thinking(推論)とProモードへの更新も近日中に行う」と明記されている

今回のInstantモデルは「GPT-5.3」ファミリーの最初のリリースである。プログラミングに特化したCodex版限定で、「GPT-5.3-Codex」が2月5日に先行して提供されていたが、まだ無印の「GPT-5.3」は登場していない。

また、GPT-5.3 Instantの発表直後、OpenAIが公式Xアカウントで「5.4 sooner than you Think.」と投稿した。GPT5.3だけでなく、GPT-5.4も早々にアップデートされる可能性がある。

「ベンチマーク至上主義」からの転換が意味するもの

GPT-5.3 Instantは、華やかなベンチマークスコアではなく、「AIとの会話が心地よいか」という主観的な体験を改善対象にした点で、OpenAIの方針転換を象徴するアップデートだ。

この方向性は、OpenAIだけの動きではない。

AnthropicもClaude Sonnet 4.6でハルシネーション低減を訴求し、Googleはgemma 3のハルシネーション問題でモデルの撤回を余儀なくされるなど、業界全体が「正確性と使いやすさ」に軸足を移しつつある。

筆者プロフィール画像

この記事を書いた人 kumori

AIツール/アプリ/ガジェットを実際に検証し、具体のユースケースまで噛み砕いて解説しています。

  • 米国の大学院で統計学(修士)
  • Python・Rによるデータ分析
  • マーケティング/広告運用(TV〜Web、数十億規模PJのリード経験)



Make a comment

*
*
* (公開されません)