
ChatGPTに追加されたGPT-4oによる画像生成機能は、ユーザーの指示に正確に従い、一貫性のあるデザインを生成できるため、趣味の範囲を超え、商業レベルのデザインワークにも使用しうる。
しかし、ChatGPTによる画像生成の最大のデメリットは、生成の速度が遅すぎること、また、使用量制限が厳しく、3-4枚の連続生成でも待機時間が発生してしまうことだ。
その点、画像生成が専門のAIサービスである「Midjourney」などは、やはり有用だ。画像を生成する速度が圧倒的に速く、数十枚を一気に生成しながら試行錯誤を繰り返せるので、アイディアを探索する段階では、GPT-4oよりも使いやすい。
GPT-4oの画像生成の精度・品質があまりにも高く、MidjourneyやStable Diffusionなど既存の画像生成AIの存続を危ぶむ声もあるが、
- アイディアの探索やラフの検証はMidjourney
- ディティールの詰めと再現性/一貫性はGPT-4o
というフェーズによる複数のAIモデルの使い分けが、現状では最善だと考えている。
本記事では、統一感のある3Dアイコンを量産することを想定し、Midjourneyでどのようにデザイン案を絞り込み、ChatGPTでそれを正確に再現・量産するか、実際のワークフローを紹介する。
画像生成AIによるデザインワークフロー
生成速度が高速で幅広いアイディアを試すことができるMidjourneyと、指示の追従精度が高く画像の一貫性を守るのが得意なGPT-4oは、お互いの得意分野・苦手分野を補い合って、非常に効率的な画像生成ワークフローを実現してくれる。
アイコンデザインであれ、グラフィックデザインであれ、筆者の基本的な作業の流れは以下の通りだ。
- MidjourneyのCreate/Explore機能で大量のアイディアを探索
- イメージに近い画像ができたら、それをリファレンスデザインとしてChatGPTで再現
- (必要であれば)FigmaやPhotoshop / Illustratorで微調整を実施
以下では、各ステップの順に、MidjourneyとChatGPTの使い方を紹介していく。
Midjourneyで基準となるアイコン画像を生成
Midjourneyには、他のクリエイターが作った画像を見ることのできる「Explore」機能と、画像生成を行う「Create」機能がある。
生成を始める前に、イメージやプロンプトのインスピレーションを「Explore」で探し、方向性が見えてきたら「Create」で多数のパターンを生成してみる、という流れがおすすめだ。
「Explore」では、生成時のプロンプトに含まれるキーワードで検索をかけることもでき、「modern icon」などと打ち込めば、アイコン画像の生成例を大量に閲覧することができる。

「Explore」で見つけた画像の中に気になったものがあれば、クリックするとその画像が生成された際のプロンプト文を閲覧することができる。
他の人のプロンプトから、自分のイメージを言語化するキーワードを発見することで、後のプロンプト作りが楽になるので、真似したいキーワードをメモしておくのがおすすめだ(例:minimalist, soft colorsなど)。

イメージが固まってきたら、「Create」タブで実際に画像を生成してみる。
今回は、カレンダーアプリの立体的なアイコンを作ることにして、様々なプロンプトを入れて、何度も生成を繰り返してみる。
Midjourneyは、一つのプロンプトに対して4つの画像が生成され、生成スピードも非常に高速なので、何度も生成を繰り返しながら、「これだ!」という画像が出てくるまで「ガチャ」を繰り返すことができる。
思わぬ素晴らしいデザインに辿り着けたりするので、プロンプトを忠実に再現するGPT-4oよりも、クリエイティブ性が強いように思う。
何度か生成を繰り返すうちに、気に入った画像(透明のケースに入った桜の3Dアイコン)が見つかったので、参考イメージとして添付して類似パターンをさらに生成し、最終的な候補を絞り込んでいく。

そして、以下のようなデザインコンセプトに辿り着いた。
「カレンダー」のアイコンを作りたかったところ、なぜか季節のアイテムとして桜がパウチされたようなアイコンになってしまった。こうした不確実性が、Midjourneyの弱みでもあり、一方で思わぬ素晴らしいデザインを見つけることができる強みでもある。
微調整はChatGPTとGPT-4oを用いて行えばいいので、これを基準の画像として進めていく。

リファレンスデザインをChatGPTに与えて統一のアイコンを量産
ChatGPTの新機能であるGPT-4oによる画像生成の強みは、既存の画像をアップロードして、それと同じデザインの画像を量産することができる点である。
また、プロンプトを忠実に守ってくれるので、全体のデザインを崩さずに、アイコンの中身をノートアプリ、メールアプリ、メッセンジャーアプリなどに差し替えるなど、ディティールの調整も可能だ。
Midjourneyでは、ChatGPTほど正確に一貫性を守ってくれないので、こうした用途ではChatGPTの方が優れている。
ChatGPTで4oモデルを指定して、Midjourneyで作成したリファレンスデザインをアップロードし、カレンダーアイコンに見えるように細部を変更するプロンプトを与える。
添付のような画像のスタイルで、カレンダーアプリの3Dアイコンを作成したい。 立体的な「31」という数字が、プラスチックのプレートの中に入っているアイコン。

すると、見事にリファレンス画像通りの立体的な枠の中に、31日という日付が描かれたカレンダーアイコンが生成された。
GPT-4oは、全体のデザインを維持したまま、画像の一部だけを差し替える、といった編集も得意なので、カレンダー以外のアプリアイコンも、同じように量産していくことができる。
ノートアプリを想定して、メモパッドを埋め込んだバージョンが以下だ。
同じ画像のスタイルで、ノートアプリの3Dアイコンを作成したい。リング付きのメモパッドが、プラスチックのプレートの中に入っているアイコン。

また、カメラアプリのアイコンも作ってみる。同一のスレッドのチャット履歴が記憶されているので、最初にリファレンス画像をアップロードしていればOKだ。
あとはプロンプト文で指示を与えるだけで、ひたすら同じデザインの画像を再現することができる。
同じ画像のスタイルで、カメラアプリの3Dアイコンを作成したい。レトロなフィルムカメラが、プラスチックのプレートの中に入っているアイコン。

こうして、Midjourneyで生成したリファレンスデザインに基づき、統一感・一貫性のある3Dアイコンのデザインを量産することができた。
今回は、3Dのアプリアイコンを例として生成したが、プレゼン中で用いるピクトグラムやイラストなども、同様の方法で生成できる。
数を打つならMidjourney、精度と絞り込みならGPT-4o
GPT-4oの画像生成機能は、明確な生成枚数の制限はアナウンスされていない。
ただ、2025年3月25日のリリース以降、あまりにも人気で生成リクエストが殺到しているからか、3-4枚イラストを生成しただけでも、頻繁に制限がかかってしまう。
以下のような待機時間に関するメッセージが表示され、作業がストップしてしまった経験がある人も多いのではないだろうか。

画像生成AIは、いい画像が出てくるまで何度もやり直す「ガチャ」要素が結構強いので、ある程度のトライアル&エラーの繰り返しは必須だ。
その意味で、生成速度も遅く、レートリミットも低いChatGPTの画像生成は、実用面で若干劣る。
しかし、細部の微調整や、一貫性・統一感を維持した生成が可能という面では、現状右に出る者はない一強状態なので、仕上げ段階に限って使うのが現実的だ。
一方で、Midjourneyは、最も安価なBasicプランでも毎月200分の高速生成(Fast Hours)が可能で、一度に4枚もの画像を、数十秒で生成することができる。

実際に、同じプロンプトでの生成スピードを比較してみると、以下のようになった(※描写するオブジェクトの複雑性によって時間は変動すると思われるので参考値)
- ChatGPT(GPT-4o):34秒/画像1枚
- Midjourney(Fast Hours):22秒/画像4枚
このような現状では、ブレストやアイディア出し、レファレンスデザインの発見までは、高速なMidjourneyを用いて、細部の微調整はChatGPTで行う、というのがベストな選択だ。
GPT-4oの画像生成機能は、現在APIには非対応でChatGPT上でしか使えない。もし将来的にAPIに対応したら、並列で複数のリクエストを送って、一度に4枚の画像を生成することなども可能になるかもしれないので、今後のアップデートに期待したい。
お気に入りのスタイルを見つけて画像生成AIを最大限活用
生成AIの発展によって、Webサイトやアプリで使用するアイコン、プレゼン資料に盛り込むアイコンやピクトグラムなど、ビジネス上で咄嗟に必要になるデザインを、即座に思い通りに生成できるようになった。
一度スタイルの基準となるリファレンスデザインを作成すれば、あらゆるイラストを、同じスタイルで生成できるようになる。
自分のお気に入りのスタイルをいくつか発見し、コレクションしておくのがおすすめだ。
ちょうど良いアイコンを求めて、フリー素材の海を彷徨う必要がなくなるので、生産性も上がるし、資料のクオリティも上がるし、いいことづくめである。