AIじゃないよ

Deep Research 徹底比較:ChatGPT vs Gemini を試して分かった違い。実物レポートも公開!

当サイトはアフィリエイト広告を一部掲載しています。

ChatGPTの「Deep Research」機能は、2025年1月末にリリースされたばかりの新機能だが、生成されるレポートの質が極めて高く、大いに話題になっている。

しかし実は、ひと足先に、全く同じ名前の「Deep Research」という機能が、GoogleのチャットAI「Gemini」にも昨年12月に実装されていたのをご存知だろうか。

ChatGPTのDeep Researchも、GeminiのDeep Researchも、大量のWebページをAIが自動でリサーチして、集めた情報をレポートにまとめ上げてくれる機能だ。

ChatGPTが月額200ドル(ChatGPT Pro)に対し、Geminiはその10分の1の月額20ドル(Gemini Advanced)で利用できるので、用途によっては、GeminiのDeep Researchを使う方が賢い選択と言える。

本記事では、ChatGPTとGeminiのDeep Research機能を、実際に3つのテーマ(金融、政策、消費者行動)で試してみて、生成されたレポートの特徴を比較してみた。

以下、一つ一つのテーマについて、詳細に両モデルの比較検証を行った結果を紹介する。あなたの用途では、ChatGPTとGeminiのどちらを使うべきか、本記事を参考に判断してほしい。

なお、以下のリンクから、Deep Researchから出力された実際のレポートを閲覧することもできる。

分野リサーチテーマChatGPTGemini
金融・経済Palantirへの投資判断サンプルレポートサンプルレポート
政治・政策排出量取引制度サンプルレポートサンプルレポート
日常生活オフィスチェアの購入候補サンプルレポートサンプルレポート
同じプロンプトをChatGPT/Geminiで試した結果



OpenAI/Googleの「Deep Research」の主な違い

OpenAIの開発するChatGPTと、Googleが開発するGeminiが、それぞれ有する「Deep Research」機能。

これは、ユーザーからの質問に答えるため、AIが5〜30分ほどの時間をかけて自律的にWebサイトを検索・収集したのち、長文のレポートとして結果を返してくれる機能だ。

Geminiの「Deep Research」機能は、2024年12月に一足早くリリースされた。月20ドルの有料版Gemini Advancedで利用でき、言語モデルとしては1世代前の「Gemini 1.5 Pro」モデルが使用されている。

一方、ChatGPTの「Deep Research」機能は、2025年1月末にリリースされた同名の機能だ。月額200ドルと非常に高額なChatGPT Pro会員のみが利用でき、言語モデルとして最新の推論モデル「o3」が使用され、論理思考力により長けている。

ともに「Deep Research」という名を冠した機能であり、実際行っていることとしても非常に似ているが、少しだけ違いがある。

中でも、ChatGPTのDeep ResearchではAIが「フォローアップ質問」を行い、ユーザーの意向を明確にするのが特徴だ。

リサーチを開始する前に、以下のような確認の逆質問を行なってくる。

一方。GeminiのDeep Researchは、「リサーチ計画」を事前にユーザーに見せて、必要があればユーザーが軌道修正できるようにしている。

筆者としては、こちらの方が事前にレポートの構成を予測できるので好みだ。

ただ、ChatGPTの強みは、最新の推論モデル「o3」を使っていることだ。モデル自らが考えながら、試行錯誤を繰り返しながら進んでいくので、こうした事前のリサーチ計画の掲示をあえて行わないのだろう。

ChatGPTのDeep Research進行中に表示される「アクティビティ」タブを見ると、o3モデルが、検索を行って閲覧したページの情報を踏まえて、都度リサーチ計画を見直しながら、繰り返し検索を行っていく様子がわかる。

金融系:投資ファンドにおける市場リサーチ業務

まずは、株式投資のための分析をChatGPTに頼んでみよう。IR情報は公開されている情報が多いので、Deep Researchは大いに役立ちそうだ。

マクロ分析から個別株分析まで、主要な情報を10分そこらでレポート化してくれるAIがいれば、人間の投資判断を大いに助けてくれることだろう。

今回は、米国株への投資を行うために、個別株の分析や市場環境の分析を行いたいとする。

「ヘッジファンドのマネージャー」という設定で、ChatGPTとGeminiに、それぞれ以下のようなリサーチ課題を与えてみた。

あなたはヘッジファンドのファンドマネージャーです。Palantirへの投資判断を行うため、総合的なリサーチを行い、レポートにまとめて下さい。レポートには以下の情報を含むが、投資判断に役立つ情報であればこれらに限定しない。

1. 企業概要の把握
    - 事業内容・顧客層・競合企業の調査
2. 決算分析
    - 直近2四半期の決算資料の確認、売上高や利益指標などの主な変動要因の考察
3. 株価動向とアナリスト評価 
    - 決算発表前後の株価推移の確認、市場の反応やアナリストの評価の整理
4. 分析結果のまとめ
    - 以上の情報を踏まえた、短期・中長期の見通しや投資判断

投資判断をする以上、決算資料の解読は必須なので、テキストだけでなく、定量的な情報も正しく取得できるかが見所だ。

また、集めた情報から、想定すべき将来シナリオを論理的に説明し、具体的なポジション戦略を提案する必要があるので、かなり高度な推論力が必要になる。

「決算資料の確認」という抽象的な指示しかしていないので、売上高、営業利益・純利益、EPS、ガイダンス、主要KPIなど、「何が重要な指標であるか」もモデル自身が考えねばならない。

生成された実物のレポートは、それぞれ以下の通りだ。見比べると瞬時にわかるが、クオリティはChatGPT Deep Researchの圧勝と言えるだろう。

例えば、直近四半期の分析を見ると、ChatGPTはニュースサイトなどから売上高などの数値データを正しく抽出できており、またプロンプトで明示されていなかったEPSや契約数などの重要指標も紹介してくれている。

一方、Geminiは殆どの定量データを取得できておらず、Gemini自ら「入手できた限られた情報に基づくと、」と留保付きで紹介しており、全くと言っていいほど分析が行えていない。

最後の投資判断に至るまでのロジックも、ChatGPTの方がずっと整然としており納得感がある。

ボラティリティが高いため短期ではオプションを用いたトレードも有効、などと、短期的な投資戦略も提案してくれつつ、中長期の市場環境やリスク要因にしっかりと触れてから、論理に飛躍のない納得感のある投資判断を提案してくれている。

一方で、Geminiは根拠となる情報が十分に収集できていないため、最後の投資判断に至るまでのロジックも薄味で、分からないことが多いから見送ろう、という感じの判断を下している。

政策系:シンクタンクにおける公共政策リサーチ業務

今度は、諸外国の政策の事例を収集し、比較するようなリサーチタスクを与えてみる。

上で紹介した投資判断の例のような「判断」や「論理的思考」というよりは、単なる文献収集や調べ物に近いタスクだ。

ただ、仕事でこういったリサーチ作業を行っている人は多いであろうから、リサーチ時間を大幅に短縮できれば、生産性への影響は大きい。

今回は、CO2の排出権取引について、ChatGPTとGeminiに以下のように尋ねた。

日本で導入される予定の「排出量取引制度」について理解するため、日本を含む先進諸国における制度概要を、表と文章を用いてレポートにまとめてください。
特に、排出権取引制度に関連して新たなビジネスチャンス・収益機会を探索するため、すでに排出権取引制度が導入されている国や地域における関連企業・団体の事例にも触れてください。

実際に生成されたレポートは、それぞれ以下の通りだ。ChatGPTの方が記述が充実してはいるが、投資レポートの例ほど、圧倒的な実力差はないようにも感じられる。

特に、各国の政策を収集して整理するだけのセクションは、ChatGPTとGeminiでそれほど違いはない。

以下はChatGPTの生成したレポートの一部である。

同等の内容を整理したGeminiの生成した表が以下である。ChatGPTの方がより構造化されているのは間違いないが、概観するための表としてそこまで悪くはない。

ただし、プロンプト後半で指示した「排出権取引制度に関連して新たなビジネスチャンス・収益機会を探索」という点への回答は、ChatGPTの方がより網羅的に検討し、かつ事例も多数集めてきてくれている(以下画像)。

シンプルな情報収集を超えて、思考が必要な部分になると、ChatGPTの力量が発揮される印象だ。

一方、Geminiが類似の内容をまとめたセクションを見ると(以下画像)、一般的な内容を列挙はしているが、そのほとんどに引用がついておらず、事例も紹介されていない。

リサーチ結果が活かされていないので、実質的にDeep Researchではなく、通常のGeminiを使っているのと変わらない状態になってしまっている。

GeminiのDeep Researchは、沢山のページを集めてはくれるものの、事例が見つかるまで何度も何度もトライアルエラーを繰り返して考え続けるほどディープではない、ということかもしれない。

ChatGPTとGeminiには10倍の価格差があり、計算資源の投下量も全く異なるであろうから、こうした違いはやむを得ないところかもしれない。

日常系:口コミリサーチと推奨商品の発見

ここまではビジネス現場でありそうなリサーチ系のタスクを試してみたが、より一般的な、日常生活でのWeb検索タスクを想定して試してみる。

オフィスチェアの購入のため、予算に応じた候補を挙げてもらい、それぞれのチェアについての口コミを収集してもらう。

日本国内で購入できるオフィスチェアにつきリサーチを行い、15万円以下の主要な選択肢を整理せよ。
想定するユーザーは30代の男性ソフトウェアエンジニアとする。
候補となる各製品の名称、ブランド、概要、特徴、価格、口コミ(ポジティブ/ネガティブ)を含むレポートとすること。

ChatGPTとGeminiのそれぞれによって生成されたレポートは以下である。

これは、結構好みが分かれそうなレポートかもしれない。

Geminiが6ブランド13製品のチェアを挙げ比較しているのに対し、ChatGPTは5ブランド6製品を挙げるに留まる。

ChatGPTは、製品数が少ない分、1つ1つの製品について、かなり深掘りしたレポーティングを行っている。

プロンプトで指示された項目に関する情報の「深さ」という意味では、ChatGPT Deep Researchの方が優れているが、冗長感があると感じる人もいるかもしれない。

一方、Geminiは、表形式で多数の製品を並べ、横並びでの比較を可能としている。

ブランド・製品の網羅性という意味では、検索したページ数が多いこともあってか、Geminiの方が上回っている。実際、筆者が過去に購入した、又は検討していた全ての製品が、Geminiのレポートには含まれている。

こうした日常の買い物の選択肢を調べたり、電化製品のレビューを読みたい程度の用途なら、ChatGPTのDeep Researchはオーバーキルだと感じる人もいるだろう。

GeminiのDeep Researchは、Google検索の結果が整理されて出てきた程度のライトさなので、こうしたWeb検索の延長にあるようなタスクには適していそうだ。

総評:コンサルならChatGPT、日常の便利屋ならGemini

総合評価としては、プロンプトに合致する的確な情報の発見、情報に基づいた論理的な議論展開などは、やはり、ChatGPTの方が(圧倒的に)強力だった。

200ドルという高額な利用料、そして最新の推論モデルo3を用いているだけあって、文章力も高く、発見した情報から思考を積み上げて、的確な結論・判断を導くのに長けている。

一方で、日常の買い物のリサーチ程度の用途であれば、無駄に冗長・くどすぎて、自分で検索した方が早いようにも感じられた。

Gemini Deep Researchも、文章力や論理力は劣るものの、情報収集と整理はそれなりに可能で、日常生活における検索の補助としては十分だ。

特に、比較候補出しなどにおいては、瞬時に幅広い選択肢を網羅してくれるので、気になったものについて、人間が追加で検索を行う際の道標として使いやすい。

ChatGPT Deep Researchは、何らかの専門分野のリサーチャーに業務でレポートを頼むようなタスクに向いており、Gemini Deep Researchは、Web上に存在する情報をざっとナナメ読みするのに向いている、という印象だ。

記事執筆現在、GeminのDeep Researchは、1世代前のモデルである1.5 Proを使用しているので、これが最新のGemini 2.0 Proや、推論モデルのGemini Flash Thinkingなどにアップデートされれば、一気に強力になる可能性も秘めている。

まとめると、現時点では、コンサル・シンクタンクの業務レベルの調査レポートが必要ならばChatGPT、必要なければGeminiがコストパフォーマンスが良いだろう。

200ドルというChatGPT Proへの課金を正当化するには、何かしら取得した情報や知見をマネタイズできないと難しいわけで、その意味でも妥当な役割分担かもしれない。



Make a comment

*
*
* (公開されません)