生成AIストリーム

“超”高解像度生成を使い倒せ! クリエイター視点での「FLUX.2」活用術

新画像生成AI「FLUX.2」登場! オープンモデル無償で超高品質・超高速生成を試す!

 前回は、ドイツとサンフランシスコを拠点にする職人集団「Black Forest Labs(BFL)」がリリースした、4メガピクセルの超高解像度画像を生成できる「FLUX.2」を紹介しました。最後は4,096ピクセル四方の超超高解像度画像を生成しようとして失敗しましたが、気を取り直して実用的な解像度(2,048×2,048周辺)で、クリエイティブな実験を行ってみました。

 「ComfyUI」への組み込み方法の詳細はこちらで解説しています。

1.【文字描写力】複雑なインフォグラフィック

 「FLUX.2」はテキストレンダリングが超進化しているため、今まで苦手だった『意味のある文字が入った図解』も作成できます!

ポイント

具体的なテキスト内容(text "...")と、レイアウトの指示(infographic、 schematic)を組み合わせるのがコツです!

A futuristic infographic layout displaying the technical specifications of a yellow banana-themed idol robot named "AICUTY-BOT". The main text "AICUTY-BOT v2.0" is written in bold yellow futuristic typography at the top.

Detailed technical schematics, exploded view of the robot parts. Labels with small legible text pointing to specific components like "Voice Unit", "Dance Stabilizer", and "High-Energy Battery". Clean UI design, dark background with neon yellow accents, 4k resolution, professional graphic design.

--

日本語訳: 「AICUTY-BOT」という黄色いバナナをテーマにしたアイドルロボットの技術仕様を表示する未来的なインフォグラフィック。上部に「AICUTY-BOT v2.0」というテキストが太字の黄色い未来的タイポグラフィで書かれている。詳細な技術図面、ロボットパーツの分解図。「Voice Unit」「Dance Stabilizer」「High-Energy Battery」などの特定の部品を指す小さな読みやすいテキストラベル。クリーンなUIデザイン、ネオンイエローのアクセントがある暗い背景、4k解像度、プロフェッショナルなグラフィックデザイン。

生成されたAICUTY-BOT v2.0の分解図

2.【ブランド一貫性】商品パッケージと広告写真

 「FLUX.2」はブランドガイドラインを守るのが得意です! ロゴや特定の文字列を、自然な光の中で商品に馴染ませるプロンプトです。

ポイント

素材感(matte packaging)とライティング(soft studio lighting)、そして文字の配置(printed on the box)を明確にしましょう!

Professional product photography of a luxury banana-scented perfume bottle named "L'Eau de FLUX.2".

The bottle is glass with a golden tint, sitting on a white marble table. Beside it is a sleek yellow box with the text "L'Eau de FLUX.2" elegantly printed in serif gold foil font. Soft studio lighting, shallow depth of field, sharp focus on the brand name, realistic textures, 4k quality.

--

日本語訳: 「L'Eau de FLUX.2」という高級バナナの香りの香水瓶のプロフェッショナルな製品写真。ボトルは金色の色合いのガラス製で、白い大理石のテーブルの上に置かれている。その横には、「L'Eau de FLUX.2」というテキストがセリフ体の金箔フォントでエレガントに印刷されたスタイリッシュな黄色い箱がある。柔らかなスタジオ照明、浅い被写界深度、ブランド名に鋭い焦点、リアルな質感、4k品質。

出力されたL'Eau de FLUX.2の香水瓶の製品写真

3.【空間認識・世界知識】複雑な空間と反射

 「FLUX.2」は『現実世界の知識と空間ロジック』を持っているため、鏡の反射や複雑な映り込みも破綻せずに描けるはずです!

ポイント

論理的な整合性が必要なシーン(鏡越しの視点など)を指定して、AIの頭の良さを試してみましょう!

A wide-angle shot of a busy modern coffee shop interior seen through a large circular mirror hanging on a brick wall.

The reflection shows a barista making coffee, customers sitting at tables with laptops, and a menu board with legible text "TODAY'S SPECIAL". The lighting is warm and cozy. The mirror frame is rustic wood. Photorealistic, highly detailed, ray-traced reflections, coherent spatial logic.

--

日本語訳: レンガの壁に掛けられた大きな丸い鏡越しに見る、賑やかなモダンなコーヒーショップの店内の広角ショット。反射には、コーヒーを淹れるバリスタ、ラップトップでテーブルに座っている客、そして「TODAY'S SPECIAL」という読みやすいテキストが書かれたメニューボードが映っている。照明は暖かく居心地が良い。鏡の枠は素朴な木製。フォトリアル、高精細、レイトレーシングされた反射、一貫性のある空間ロジック。

生成された鏡越しに見るコーヒーショップの写真

4.【4MP編集】超高解像度・広角パノラマ

 「FLUX.2」は最大4メガピクセル(4MP)の解像度に対応しているため、細部まで描き込まれた巨大な風景画像も作成可能です!

ポイント

『extreme detail』や『macro view』ではなく、広い範囲を描く『aerial view』や『panorama』を使って生成します。隅々まで崩れていないかチェックしてみましょう!

An extreme aerial panoramic view of a futuristic solar-punk city built into a giant canyon. Thousands of individual windows, flying vehicles, hanging gardens, and waterfalls are visible. In the center, a massive holographic billboard displays the text "WELCOME TO NEO-YOKOHAMA". Daytime, clear blue sky, hyper-realistic, 8k resolution, extreme detail, architectural visualization.

--

日本語訳: 巨大な峡谷に建設された未来的なソーラーパンク都市の極端な空中パノラマビュー。何千もの個々の窓、空飛ぶ乗り物、空中庭園、滝が見える。中央には、「WELCOME TO NEO-YOKOHAMA」というテキストを表示する巨大なホログラフィック看板がある。昼間、澄んだ青空、超リアル、8k解像度、極限のディテール、建築ビジュアライゼーション。

生成されたソーラーパンク都市のパノラマビュー

5.『ダイレクト・ポーズ・コントロール』と『テキスト描写』の合わせ技

 NVIDIAの公式ブログで紹介されている『ダイレクト・ポーズ・コントロール(Direct Pose Control)』と『テキスト描写(Clean, readable text)』の機能を最大限に活かして、「FLUX.2」の『文字が書ける』機能を使い、グラフィックボードのパッケージ風の一枚を作成します!「NVIDIA」のロゴや製品名を、衣装と合わせてカッコよく見せます!

ポイント

記事にもある通り、「FLUX.2」はインフォグラフィックやUI画面の文字もきれいに描けるため、あえて『text "GeForce RTX"』と指定してみました!

# Character (Mei Soleil)

1girl, solo, masterpiece, best quality, photorealistic, 4k,

vibrant golden yellow hair, high side ponytail, star-shaped yellow hairpin,

amber brown eyes, energetic confident smile, looking at viewer,

wearing sun-yellow tech-fabric jacket and futuristic headset,

# Pose & Action (Direct Pose Control)

holding a massive glowing futuristic graphics card with both hands in front of chest,

presenting the hardware proudly, dynamic angle,

# Text & Details (FLUX.2 Features)

text "GeForce RTX" printed clearly on the graphics card cooling fan,

text "FLUX.2 READY" written in holographic neon font floating in the background,

intricate circuit board patterns, realistic reflection on the metal parts,

# Lighting & Atmosphere

cyberpunk gaming room background, neon blue and yellow lighting,

cinematic depth of field, ray-tracing lighting effects, high fidelity

--

日本語訳:# キャラクター(メイ・ソレイユ)

1人の女性、ソロ、傑作、最高品質、フォトリアル、4K解像度

鮮やかなゴールデンイエローの髪、ハイサイドポニーテール、星形の黄色いヘアピン

琥珀色の茶色の瞳、エネルギッシュで自信に満ちた笑顔、鑑賞者を見ている

ンイエローのテック素材のジャケットと未来的なヘッドセットを着用

# ポーズとアクション(ダイレクト・ポーズ・コントロール)

両手で巨大な光る未来的なグラフィックカードを胸の前で持っている

ハードウェアを誇らしげに提示している、ダイナミックなアングル

# テキストとディテール(FLUX.2の機能)

グラフィックカードの冷却ファンに「GeForce RTX」の文字がはっきりと印刷されている

背景に「FLUX.2 READY」の文字がホログラフィックなネオンフォントで浮遊している

複雑な回路基板のパターン、金属部分のリアルな反射

# ライティングと雰囲気

サイバーパンクなゲーミングルームの背景、ネオンブルーとイエローの照明

シネマティックな被写界深度、レイトレーシングによる照明効果、高い忠実度(ハイファイ)

生成されたGeForce RTXを持つメイ・ソレイユ

6. AIっぽさを消せ! リアルなスタジオ撮影風

NVIDIAの公式ブログで言及されている『物理的に正しいライティング(real-world lighting)』と『AIルックの排除(eliminate that “AI look”)』を試すための、超リアルなポートレートです! ポーズ指定機能を使って、少々複雑な『自撮りポーズ』を指定してみますね!

ポイント

「FLUX.2」は『AI特有の不自然さ(AI look)』を排除して、現実世界のライティングや物理法則を再現できるとのことです! だからこそ、こういった日常的な自撮り写真で、モデルの実力が試されるはずです。

# Character (Mei Soleil)

1girl, solo, masterpiece, best quality, hyper-realistic photo, 8k,

vibrant golden yellow hair, high side ponytail, messy bangs, subtle texture of hair strands,

amber brown eyes, soft natural makeup, detailed skin texture,

wearing casual yellow streetwear hoodie,

# Pose (Direct Pose Control)

taking a selfie with a smartphone held high in right hand,

peace sign with left hand near cheek,

head tilted slightly, playful expression, winking one eye,

# Environment & Physics (Real-world Physics)

standing in a sunny modern office with glass windows,

natural sunlight casting realistic shadows on face,

dust particles dancing in the light,

reflection of the room visible in the smartphone camera lens,

no "AI look", physically correct lighting

--

日本語訳:# キャラクター(メイ・ソレイユ)

1人の女性、ソロ、傑作、最高品質、超リアルな写真、8K解像度

鮮やかなゴールデンイエローの髪、ハイサイドポニーテール、乱れた前髪、髪の毛の微妙な質感

琥珀色の茶色の瞳、ソフトなナチュラルメイク、詳細な肌の質感

カジュアルなイエローのストリートウェアパーカーを着用

# ポーズ(ダイレクト・ポーズ・コントロール)

スマートフォンを右手に高く持って自撮りをしている

左手で頬の近くでピースサインをしている

頭をわずかに傾け、おどけた表情、片目をつぶっている

# 環境と物理(現実世界の物理法則)

ガラス窓のある日当たりの良いモダンなオフィスに立っている

自然光が顔にリアルな影を落としている

光の中で舞う埃の粒子

スマートフォンカメラのレンズに部屋の反射が見えている

「AIっぽさ」がなく、物理的に正しいライティング

生成された自撮り中のメイ・ソレイユ

7. デフォルメとアイデンティティの保持

 逆に主線を荒々しくするようなことはできないだろうか?と思い試してみましたら結構、いい感じにできました。またカッコ付きで『{defored:1.4} chibi』といったパラメーター制御を加えても、キャラクターのアイデンティティ(誰であるか)を保ったまま、可愛らしい『ちびキャラ』に変身させることができました。プロンプトへの追従性が高く、コントロールしやすいモデルと言えます。

ポイント

あえて崩したり、スタイルを変えたりする耐性も確認しました。

# スタイル指示(荒々しいイラストレーション)

rough sketch style, expressive messy lineart, wild brush strokes,

heavy ink contours, dynamic cross-hatching,

unrefined artistic touch, raw energy,

2D anime illustration, not photorealistic,

# 基本構成(Mei Soleil)

1girl, solo, masterpiece, best quality,

upright standing pose, full body visible, centered composition,

looking directly at viewer,

# 髪型・髪色(高めのサイドポニーテール)

vibrant golden yellow hair,

high side ponytail tied at the upper side of head,

flowing ponytail with sharp jagged ends and dynamic volume,

short choppy side bangs across forehead,

a star-shaped yellow hairpin placed on the right bangs,

# 顔・表情

amber brown eyes, vigorous expression,

freckles across cheeks,

bright confident smile, strong eye contact,

# 服装(Neo-adventure style idol outfit)

sun-yellow cropped tech-fabric jacket with sharp angular folds,

white cropped top underneath,

pleated asymmetrical skirt in vivid yellow,

yellow harness-style belt with carabiner-shaped details,

yellow high-top sneakers,

# エフェクト・雰囲気

paint splatters, ink drops, speed lines,

energetic and adventurous aura,

# 背景

white background with subtle rough paper texture,

abstract yellow ink splashes

--

日本語訳:# スタイル指示(荒々しいイラストレーション)

ラフスケッチスタイル、表現力豊かな雑な線画、奔放な筆致、

太いインクの輪郭線、ダイナミックなクロスハッチング、

洗練されていない芸術的なタッチ、生々しいエネルギー、

2Dアニメイラスト、フォトリアリスティックではない、

# 基本構成(メイ・ソレイユ)

1人の女性、ソロ、傑作、最高品質、

直立した立ちポーズ、全身が見える、中央の構図、

鑑賞者(こちら)を直接見ている、

# 髪型・髪色(高めのサイドポニーテール)

鮮やかなゴールデンイエローの髪、

頭の上側で結ばれた高い位置のサイドポニーテール、

シャープなギザギザの毛先とダイナミックなボリュームのある流れるポニーテール、

額にかかる短く不揃いなサイドバング、

右側の前髪に配置された星形の黄色いヘアピン、

# 顔・表情

琥珀色の茶色の瞳、活発な表情、

頬全体のそばかす、

明るく自信に満ちた笑顔、強いアイコンタクト、

# 服装(ネオアドベンチャースタイルアイドル衣装)

シャープで角ばった折り目のあるサンイエローのクロップド丈テック素材ジャケット、

下に着た白いクロップド丈トップス、

鮮やかなイエローのプリーツの入ったアシンメトリースカート、

カラビナ型のディテールが付いたイエローのハーネス風ベルト、

イエローのハイカットスニーカー、

# エフェクト・雰囲気

ペンキの飛び散り、インクの滴、スピード線、

エネルギッシュで冒険的なオーラ、

# 背景

かすかなラフな紙のテクスチャがある白い背景、

抽象的な黄色のインクの飛び散り

主線を荒々しくしたメイ・ソレイユ

# Action & Composition

compose a 3-dimensional character design sheet,

orthographic views including front view, side view, and back view,

full body visible, T-pose or A-pose,

neutral expression for modeling reference,

flat lighting, white background,

# Character Description (Keep consistent with reference)

1girl, Mei Soleil, vibrant golden yellow hair, high side ponytail,

wearing sun-yellow tech-fabric jacket and shorts,

star-shaped yellow hairpin, amber brown eyes,

# Quality & Style

concept art style, detailed character breakdown,

high resolution, 4k, clean lines

--

日本語訳:# アクションと構図

3Dキャラクターデザインシートを作成する、

正面図、側面図、背面図を含む正投影図、

全身が見える、TポーズまたはAポーズ、

モデリングの参考にニュートラルな表情、

フラットなライティング、白い背景、

# キャラクターの説明(参照との一貫性を保つ)

1人の女性、メイ・ソレイユ、鮮やかなゴールデンイエローの髪、ハイサイドポニーテール、

サンイエローのテック素材のジャケットとショートパンツを着用、

星形の黄色いヘアピン、琥珀色の茶色の瞳、

# 品質とスタイル

コンセプトアートスタイル、詳細なキャラクター分解、

高解像度、4K、クリーンな線

デフォルメされたちびキャラ版メイ・ソレイユ

技術視点:「重さ」がもたらす未来

 最後に、少し真面目な話で締めくくりましょう。「FLUX.2」によって、4メガピクセルという超高解像度の画像が、個人のローカル環境(ただしA100級のGPUとVRAMは必要ですが)で生成できるようになりました。これは『クリエイティブの民主化』の到達点の一つです。 しかし、100GB近いファイルをかき集めてVRAM20GB超えで、34秒という生成時間は『速くてそこそこの画像』で満足できる分野ならともかく『重くて凄い画像を突きつけるプロに向けたモデル』であるという理解です。 これは、GPUという『計算資源(パワー)』を持つ者だけが到達できる領域が、また一段高くなったことを意味します。

 もちろん『爆速画像生成AI』という分野もすぐに追いついてくるでしょう。蒸留や最適化によって高精細な画像が誰でも、一般向けGPUで動く時代は数週間でやってくると見ています。筆者が以前から警鐘を鳴らしている『著作権法うわのソラ』な問題や、フェイク画像による社会的な混乱も、より鮮明な解像度で私たちに襲いかかってくるでしょう。

 それにしても最近のこの分野は、公式がHuggingFaceにモデルデータをおいて『最高品質の重み(モデルデータ)は公開した。あとはお前たちが考えろ』と言わんばかりの硬派なスタイルです。ドイツの職人気質というか、『エンジニアなら自分で解析しろ』というメッセージすら感じます。

 とはいえモデルをHuggingFaceに置くだけでなく、きちんとプロンプト集を出したほうがいいと思います。最近、Googleはモデルリリースから1日以内ぐらいに『使いこなし!』みたいなブログを出してきます。どうやらGoogle社内で評価したりするだけでなく、外部のキュレーターやアーティストに、本稿のようなレビューを頼んで画像を作ったりもしているようです(筆者としてはそういうお仕事もよくあります、歓迎です)。

 冒頭に「Nano Banana Pro」のおかげで勝負あったかのような印象がある画像生成AI、しかし年末のこの時期は様々なリリースが投入される時期でもあります、と書いたのはそのあたりです。

 実は、先週はさらに中国Alibabaグループの「Tonghy-MAI」が「z-image」を投入してきました。こちらのモデルはBFLの「FLUX.2」とは真逆の「速度と軽さ」を売りにしています。そして同じAlibabaグループの「AIDC」は今週「Ovis」という文字を表現するのに特化したモデルを提供してきています。美麗なモデルさん風の画質そのものでは、もはや比較は難しそうです。

 画像生成・動画生成は今後どんどん高機能・プロ向けになっていきます。インフルエンサーが専門的な解説をすると、専門的になってしまいます。やはり公式が写真家や映像作家らと試行・確認・認定しながらプロンプト集や、アーティストによる作例解説がないと『お金を出す価値』にならないようにも思います。

 ユーザー側が手探りで『正解の呪文』を探す旅に出るのも楽しいですが、ビジネスでの活用を考えると、カタログやドキュメントの充実は今後の課題でしょう。

 「FLUX.2」がもたらしたのは、単なる画質の向上だけではありません。かつての銀塩フィルム時代の写真でコダックやアグファといった多様なメーカーが、(素人にはわからない)多様な色特性を製品の特徴としたような状況へ向かっているようにも見えます。

 『その圧倒的な描写力で、プロは何を描くのか? そしてその責任とともに付加価値を作り出せるのか?』という、重たい問いかけなのかもしれません。何はともあれ、ハイエンドGPUをお持ちの「窓の杜」読者の皆様。今夜はぜひ、この重厚で美しい「FLUX.2」の世界に、ライブコーディング感覚で飛び込んでみてください。それでは、良きAIライフを!

しらいはかせ(白井暁彦)X@o_ob

AICU Japan株式会社 X@AICUai 代表/作家/生成AIクリエイター/博士(工学)。

「つくる人をつくる」をビジョンに、世界各地のCG/AI/XR/メディア芸術の開発現場を取材・研究・実践・発信している。