Nano Banana 2:Pro級の画像品質が半額・倍速で手に入る、AI画像生成の新標準
Google DeepMindのNano Banana 2はArena 1位の画像生成品質を前世代の半額・高速で実現。Google検索連携による正確なランドマーク描画やC2PA対応など独自機能も搭載し、Geminiアプリなら無料で使える
14 posts
Google DeepMindのNano Banana 2はArena 1位の画像生成品質を前世代の半額・高速で実現。Google検索連携による正確なランドマーク描画やC2PA対応など独自機能も搭載し、Geminiアプリなら無料で使える
アイディア探索はMidjourney、仕上げと統一感の維持はGPT-4oという使い分けが最善。実際の3Dアイコン量産ワークフローを紹介
GPT-4oネイティブ画像生成「4o Image Generation」の全機能ガイド。正確な文字描写、キャラクター同一性の維持、透過PNG生成、部分編集など、DALL-Eでは不可能だった実用レベルの画像生成をサンプル付きで解説する。
MidjourneyのEditor機能で、生成済み画像の部分修正・キャンバス拡張・アスペクト比変更がブラウザ上で完結する。インペインティングとアウトペインティングの実例付きで使い方を解説する
クラウドGPUプラットフォームReplicateでWhisper v3の文字起こし(1分音声を約13.9秒・約0.46円)とSDXLの画像生成を実行。API呼び出しの具体的手順と料金体系を実例付きで解説する。
Midjourney v6の全パラメーターを網羅解説。--crefで同一キャラクター維持、--srefでスタイル統一、--arでアスペクト比変更など、生成画像の品質を引き上げる必須6選と応用パラメーターを紹介する
GPT-4 Turbo・DALL-E 3・Whisper・TTSなどOpenAI全モデルをGoogle Colabで動かせるノートブックを公開。プログラミング不要、APIキーだけで即利用可能
DALL-E 3をAPIで直接操作できるGoogle Colabノートブックを公開。ChatGPTを介さずプロンプトを完全制御でき、日本語でも英語と同等の画像生成結果が得られることを実験で確認
Style DecoderとStyle Slidersを使えば、Midjourneyのスタイルコードから元のチューナーURLやプロンプトを復元し、スライダーで微調整まで行える。他人のスタイルを学ぶ最短ルートを紹介する
MidjourneyのStyle Tunerで一貫したアートスタイルを作成し、--styleコマンドで何度でも再利用する方法を解説。リアル写真・印象派風など高品質スタイルコードも紹介する
BingチャットとBing Image Creatorを使えば、OpenAIの画像生成AI「DALL-E 3」を無料で利用できる。プレゼン資料やSNS投稿に使えるイラスト素材を、プロンプト一つで生成する具体的な手順と週15回の制限についてまとめた。
DALL-E 3とChatGPTでベクターデザイン素材を作成し、SVG変換する手順を解説。プロンプトの具体化と反復修正のコツを押さえれば、ノンデザイナーでもプレゼン用アイコンやロゴを量産できる
Vast.aiはRTX 4090を時給約50円からレンタルできるGPUクラウドだ。アカウント作成からStable Diffusion・LLMの実行環境構築まで手順を解説する。
Apple Silicon MacでStable Diffusionを動かす手順をWebUIの導入からモデル選定、VAE設定、プロンプトの書き方まで一通り解説する。M1以降なら実用的な速度で画像生成が可能だ。