画像生成AIのMidjourneyにおいて、狙ったアートスタイル通りの画像を、異なる被写体で安定的に生成するのは中々に難しい。
例えば、女性の写真、車の写真、犬の写真などを、全て同じ80年代の洋画風のスタイルで生成する、などの用途だ。
23年11月に利用できるようになったばかりの新機能「Style Tuner」は、一度作り込んだスタイルを、別の画像を生成する際に、プロンプトの最後にコマンドを入れるだけで何度も繰り返し適用できるという革新的な機能だ。
Webサイトを制作する際の写真素材の統一感の確保や、デザインのコンセプトをまとめたムードボードの制作、将来は映画やドラマのコンテの制作まで役立つかもしれない。
例えば、以下はリアルな写真風のスタイルを適用した例だ。
一度スタイルを作り込めば、親子の写真、オフロードを走るSUV車の写真、山と湖の風景写真を、全て同じスタイルで安定的に生成できる。
しかも、Styleは他人にコマンドを教えるだけで簡単に共有できるので、SNS上ではさまざまなクリエイターやデザイナーが素晴らしいStyleの数々を公開している。
この記事では、Style Tunerの使い方を詳細にステップバイステップで解説し、実際にStyleを作成するまでのプロセスをお見せする。
また、SNS上でクリエイターが公開しているおすすめのStyleをいくつか紹介するので、自分でも使ってみて欲しい。MidjourneyのStyle Tunerの凄さが体感できるはずだ。
スタイルコマンド(–style)の使い方の基本
Midjourneyのプロンプトの末尾に、「–style xxxxxxxxxxxx」という文字列を追加するだけで、スタイルを適用できる。
例えば、以下のプロンプトは「オフロードを走るSUVカー、Styleを適用、16:9のアスペクト比」を意味している。
/imagine Photo of SUV car driving off-road --style 4yuG4HZyCHwGsXsx --ar 16:9
--style
コマンドの後に来るランダムなように見える文字列(4yuG4HZyCHwGsXsx)は、「スタイルチューナー」を利用して作成するものだ。
この文字列は、スタイルチューナーを使って一度作成すると、何度でも繰り返し利用することができる上に、他人にこの文字列を教えれば、他人もそのスタイルを適用できるという優れものだ。
Midjourneyスタイルチューナーを使ったスタイルの作り方
「/imagine」コマンドと「/tune」コマンド
通常、Midjourneyで画像を生成するには、Discord上でメッセージの冒頭に/imagine
コマンドを打ってから、生成したい画像のプロンプトを打ち込んでいく。
この記事では、2000年代風のちょっとレトロなストリートスナップのスタイルを作成することを目指して、以下のプロンプトを用いていく。
Photography, a girl walking through Berlin, in the style of y2k aesthetic, 32k uhd, light pink and white, ilford delta, sharp focus
まずは普通に/imagine
コマンドで、いつも通り画像を生成してみる。実際に生成された画像は以下の4種だ。
イメージに近いのは上の2枚で、この2枚のような画像を安定的に出し続けられるようなスタイルを作成していきたい。
スタイルチューナーを起動したいときは、/imagine
の代わりに/tune
コマンドを打って、生成したい画像のプロンプトをいつも通り書き込む。
ここでは、先ほどと全く同じプロンプトを用いている。
すると、次のようにスタイルチューナーを起動するかを尋ねるメッセージが表示されるはずだ。
スタイルチューナー起動時のオプション
スタイルチューナーは、使うたびに専用のURLが発行されて、ブラウザ上で動作する機能だ。
ブラウザ上で、16〜128ペアの画像の選択肢を見せられるので、ペアの中でどちらが自分の好みのスタイルかを選択していくと、その選択を踏まえたスタイルが作成される仕組みだ。
/tune
コマンドを打った直後に、次のような選択肢が与えられる。
- いくつの「Style Directions」を用意するか。16ペア〜128ペアを選択。
- 「Default」または「Raw」モードの選択(rawモードは自動装飾が減り、よりプロンプトに近い画像が生成されるモード)
ペアが多ければ多いほど、より正確に自分の好みを反映することができるが、128ペアも作成すると、かなりクレジットを消費してしまう。
Style TunerはFastモードでなければ使用できず、画像のペア数によって有料プランの「Fast GPU Time」を消費する量が増える。
例えば、32ペアを作ると、0.3時間を消費する。
月10ドルのBasic Planは1ヶ月あたり3.3時間のFastモードが利用できるが、何度もスタイルチューナーを使っていると結構ダメージが大きいので気をつけよう。
スタイルチューナーを実際に触ってみよう
スタイルチューナーの起動時オプションを選択して「Submit」をクリックすると、スタイルチューナーを起動できる。
少し待ち時間が発生するが、「Style Tuner Ready!」というメッセージが表示されたら、URLをクリックするとスタイルチューナーを使用できる。
スタイルチューナーのURL自体も、他人にシェアすることが可能だ。
この記事で利用しているスタイルチューナーのURLは以下なので、実際に触ってみたい人は閲覧してみてほしい。
以下では、このページを見ながら実際にスタイルを作成していく。
スタイルチューナーの使い方
スタイルチューナーを開くと、沢山の画像ペアが表示される。
基本的な使い方は、左右のどちらが自分のイメージに合っているかを選択し、右、左とクリックしていくだけだ。
Y2Kっぽい雰囲気、狙った通りの薄いピンク色が出ている方を選んでいく。
これによって、このスタイルを他の画像に適用した際に、同じようなテイストの写真が生成されるようになるのだ。
今回は32ペアを生成している。
選択を進めていくと、画面の下部に、全部でいくつの回答をしたかが表示される。
ペアのうちどちらも微妙な時は選択しないこともできるが、できるだけ多くの選択をした方が、スタイルを自分の意図に近づけることができる。
画面下部に表示されている「Your code is:」の部分が、自分の選択を踏まえて決定された固有のスタイルコードになる。
将来の画像生成プロンプトで使用するために、このコードをコピーして保存しておく。
今回生成したスタイルコードは、b296n33wN6X586wl
だ。
以下では、このコードを使って新たな画像の生成を行なっていく。
スタイルを適用した新たな画像の作成
/imagine
コマンドを使用し、プロンプトとコピーした --style <code>
パラメーターを入力して、スタイルに合わせた画像を生成する。
この記事の冒頭で使用したプロンプトを、今回もそのまま使って、末尾にスタイルをつけた時にどのように変化するかを見てみよう。
Photography, a girl walking through Berlin, in the style of y2k aesthetic, 32k uhd, light pink and white, ilford delta, sharp focus
このプロンプトの、--style b296n33wN6X586wl
の有無による違いは、以下の通りだ。
1枚目が最初に生成した--style
コマンドなしのもの。右下のモノクロ写真などがかなりイメージから外れている。
2枚目が、全く同じプロンプトだが、--style
コマンドありのものだ。ご覧の通り、意図した通りのスタイルに、生成された全ての画像が近づいていることがお分かりいただけるだろう。
さらに、これを別のシナリオに適用して、スタイルが維持されるかどうかを確認してみる。
元々のプロンプトでは、a girl walking through Berlin
としていたところ、「Berlin」を「New York」に変更して、--style
コマンドありで生成してみたのが以下だ。
写真の要素が変わっても(ベルリンっぽい光景から、ニューヨークっぽい混雑した街中になっても)、同じスタイルが維持できている。
トライアンドエラー・その他のツールの利用
スタイルコードとプロンプトは複雑に相互作用するため、とにかく試行錯誤で色んな組み合わせを試してみることが重要そうだ。
スタイルコードを生成する際に使った被写体やテーマ(今回は女性のストリート写真)から大きく外れたプロンプトを用いると、同じスタイルコードを適用してもイマイチな結果になることも多いように感じられる。
したがって、基本的には、スタイルコードを得る際に使ったプロンプトと、スタイルコードを使って画像生成する際のプロンプトは、類似のもので行くことになる。
また、--stylize
または--s
コマンドを付け足すと、20から1000までの値で、スタイルをどの程度強く適用するかを選択できる。
例えば、--s 50
とすれば、かなり弱くスタイルが適用されることになる。
もちろん、通常の画像生成と同じく、Upscale、Pan、Zoom-Out、Remix、Vary-Regionなど、Midjourneyの追加ツールを使用して、画像をさらに改善することもできる。
SNSで見つけた超ハイクオリティなStyleのまとめ
--style
コマンドで、実用レベルの高品質なコードを見つけるには、長時間のトライアルアンドエラーが必要になる。
ここでは、SNS上でデザイナーやイラストレーターが公開しているスタイルコードを実際に適用した例を紹介していく。
Style Tunerを使いこなせば、ここまでハイレベルな画像生成ができるということが実感してもらえるはずだ。
長時間露光のストリート写真を生成できるスタイルコード
新幹線や車などの動きのある乗り物を、遅いシャッタースピードで撮影したようなエフェクトをかけるためのスタイルがこちら。
Midjourneyでプロンプトだけでこのエフェクトを安定して出すのは非常に難しいので、スタイルチューナーの利点が大いに発揮されている。
使用しているプロンプトは以下の通りだ。
/imagine long exposure image of Tokyo --style 1gbWfpC3vGoCri --ar 16:9
XユーザーのArtiMindArt氏が公開しているスタイルコードを用いた。
超リアルなペット写真を生成できるスタイルコード
非常にリアルな写真風のスタイルで、ベッドで眠るトイプードルの写真を出力したのがこちら。
犬の種類を変えても同じくハイクオリティの画像を生成することができる。
light brown toy poodle dog sleeping in bed on the bedside table on grey background, in the style of y2k aesthetic, 32k uhd, light pink and white, ilford delta, sharp focus --style 8YHZ0RGqm-3UmPObQEqr-D5u2S297-4yuG4HZyCHwGsXsx-2dxwwxVFE3LC-dCqlpRRnUKWsgbGX68IwPCNVIcd-4G7sJvV0vQTb-2dQJV5KAaXqo-b7SDrORxyc24CLtaDb --ar 16:9
XユーザーのTatiana Tsiguleva氏が公開しているスタイルコードを用いた。
超リアルな風景写真・人物写真を生成できるスタイルコード
これは、この記事冒頭で紹介した写真と同じものだ。
人物であれ風景であれ、同じLUTを適用したような統一感のある写真を安定して生成できる。
例えば、山と湖の写真がこちら。
photo of mountains and lakes --style 4yuG4HZyCHwGsXsx --ar 16:9
オフロードを走るSUV車というずいぶん違う被写体も、安定してリアルに生成される。
Photo of SUV car driving off-road --style 4yuG4HZyCHwGsXsx --ar 16:9
さらに、親子のポートレートのような人物もいい感じに生成できる。
Photo of a mother and a little girl --style 4yuG4HZyCHwGsXsx --ar 16:9
これもXユーザーのTatiana Tsiguleva氏が公開しているスタイルコードを用いた。
印象派風のストリート写真を生成できるスタイルコード
上記で紹介したようなリアリスティックな写真のスタイルもあれば、特徴的なアートスタイルを、スタイルコードを使って実現することもできる。
これは印象派風のスタイルとリアル写真のスタイルを組み合わせたようなスタイルコードだ。
これもXユーザーのTatiana Tsiguleva氏が公開しているスタイルコードを用いた。
スタイルコードから、元々のスタイルチューナーのURLを特定する方法
他の人が作成して使っているスタイルコードは、自分でも使うことはできるが、通常、そもそも元々どのようなプロンプトで作られたのかを知ることはできない。
他のユーザーが公開しているスタイルコードで、特に気に入ったものがあった時、オリジナルのプロンプトを知りたくなるし、オリジナルのスタイルチューナーにアクセスしたくなる。
この点、Midjourneyのコミュニティで、スタイルコードさえ分かれば、元のスタイルチューナーのURLを復活させられる「Style Decoder」という超便利なツールが開発されている。
以下の記事で使い方などの詳細は解説しているが、この記事で紹介したスタイルコードも、Decoderを使えば全て元々のオリジナルプロンプトを見ることができる。
スタイルチューナーの使い方をマスターするには、他のユーザーがどのように使いこなしているかを見るのが一番だ。
スタイルチューナーとスタイルコードの基本的な使い方を理解したら、次はDecoderを使って他のユーザーのスタイルチューナーの使い方を学んでみることをおすすめする。