はじめに
こんにちは!AI画像生成ブログへようこそ。
今回はStable Diffusion XLのチェックポイント「CyberRealistic XL」を使って、「歯車」をテーマに画像を生成してみました。
まるで映画のセットのような、重厚で物語性のある世界観の創造に挑戦します。
テーマは「巨大な歯車」。朽ち果てた廃墟の部品から、街の生活を支える心臓部まで、歯車の持つロマンを Stable Diffusion XL(SDXL)で描き出します。
この記事では、フォトリアル系最強の呼び声も高いチェックポイント「CyberRealistic XL」を相棒に選び、シンプルなアイデアから、時代背景や機能、そしてファンタジーの要素を融合させた「究極の巨大時計」が生まれるまでの、プロンプト試行錯誤の全過程を、分かりやすく公開します。
CyberRealistic XLを「相棒」に選んだ理由
今回、数あるSDXLチェックポイントの中から「CyberRealistic XL」を選んだのは、そのフォトリアリズムに特化した性能に惚れ込んだからです。
AI画像生成では、ディテールの表現が非常に重要になります。特に、金属の「錆び」「へこみ」「光沢」といった質感は、画像にリアリティと説得力をもたらす上で欠かせません。
CyberRealistic XLは、複雑なプロンプトを多用せずとも、写実的な人物や風景の生成に特化しているため、こうした金属の物理的な質感を忠実に再現するのに最適だと考えました。
まるで写真家がレンズを選び、被写体に光を当てるように、このモデルを使えば、プロンプトという言葉の力で、現実世界と見紛うほどの質感を生み出すことができるのです。
モデル選定の経緯と最初の挑戦

こんにちは!今回は「歯車」をテーマに、金属のリアルな質感や光の反射を追求したいですね。この表現に最も適したモデルを選びましょう。

ありがとうございます!金属の錆びや光沢を表現したいので、CyberRealistic XLでお願いします。リアルな写真みたいな画像が得意なモデルでしたよね?

素晴らしい選択です!CyberRealistic XLは、フォトリアリズムに特化しており、複雑なディテールや質感を忠実に再現するのに絶大な強みを持っています 。
今回のテーマである「錆び」や「光沢」といったマテリアル表現の解像度が非常に高いのが特徴です。

それは頼もしいですね!では、最初の画像はシンプルに「錆びた巨大な歯車のマクロショット」でお願いします。

かしこまりました。マクロショットで、錆びや緑青(ろくしょう)のディテールを際立たせ、CyberRealistic XLの持つリアルな質感描写能力を試すプロンプトを作成しますね。
🛠️ 初期試行:錆びた巨大歯車のマクロショット
| 項目 | 設定値 |
| チェックポイント | CyberRealistic XL |
| テーマ | 錆びた巨大な歯車のマクロショット |
| ポジティブプロンプト | (masterpiece, best quality, ultra-detailed, photorealistic:1.3), macro photo of a huge rusty gear, covered in intricate rust and verdigris, dripping with water, sharp focus on the rust texture, cinematic lighting, dramatic contrast, deep shadows, bokeh background, detailed metallic surface. |
| ネガティブプロンプト | (painting, drawing, illustration, cartoon, anime, 3d, sketch:1.5), blurry, low quality, deformed, ugly, flat lighting, smooth surface, plastic, clean. |
| Automatic1111設定 | Steps: 30, Sampler: DPM++ 2M SDE Karras, CFG Scale: 5, Resolution: 896x1152 |


生成できました!金属のザラザラした錆の質感や、水滴のリアルさは、さすがCyberRealistic XLといったところですね。

確かに錆はすごいリアルです!でも、ただの錆びた歯車になってしまいましたね。もっと「この歯車が使われていた場所」とか「どんな歴史があったのか」が伝わるような、世界観がほしいです。

(笑) 分かります。AIアートでは、「単なる物体の描写」から「物語のある情景」へと昇華させるのが、最も重要な壁なんです。AIは、こちらが意図的に「文脈(コンテクスト)」を与えないと、被写体以外の要素を自動で補完してくれません。

「文脈(コンテクスト)」ですね。では、次に「この歯車があったら面白そうな世界」をプロンプトで挑戦させてください!
第1章:旅の始まり — 「ラピュタ風」への方向転換

かしこまりました!では、最初に提示された「物語」の要素を探るため、自然と古代技術が共存する「天空の城ラピュタ」のような世界観で再挑戦しましょう。

「ラピュタ」のような、自然に覆われた古代遺跡の歯車を主役にできますか?ネオン系やサイバーパンクなどの要素は不要です!

承知いたしました。「Studio Ghibli-style」と「Overgrown with moss」を強調し、幻想的な情景を目指します。
🛠️ 試行2:自然に覆われた古代遺跡の歯車(ラピュタ風)
| 項目 | 設定値 |
| テーマ | ラピュタ風の古代遺跡にある、自然に覆われた巨大な歯車 |
| ポジティブプロンプト | A breathtaking Studio Ghibli-style image of a massive, ancient, and rusty gear, overgrown with vibrant green moss, winding vines, and fantastical flowers with bioluminescent petals. The gear... is partially submerged in a crystal-clear, mystical water channel flowing through the weathered stone ruins of a floating city. Ethereal, soft sunlight streams through the canopy of a huge, ancient tree... No neon lights or cyberpunk elements present. |
| ネガティブプロンプト | (painting, drawing, illustration, cartoon, anime, 3d, sketch:1.5), blurry, low quality, deformed, ugly, flat lighting, smooth surface, plastic, clean. |
| Automatic1111設定 | Steps: 30, Sampler: DPM++ 2M SDE Karras, CFG Scale: 5, Resolution: 896x1152 |
AI: このプロンプトで生成された画像がこちらです。




成功の要因は、「Studio Ghibli-style」というスタイルキーワードを冒頭に置いたことです。AIは、このキーワードから連想される**「柔らかな光」「生命感あふれる緑」**といった要素を、自律的に画像全体に適用してくれます。

これです!この「物語と美しさ」が両立した世界観がほしかったんです。
第2章:歯車の役割を変える — 「生活」と「産業」への進化

次の挑戦として、この歯車を「廃墟」ではなく、「実際に利用して人々が暮らしに取り入れている風景」を作ってみたいです。歯車が動くことで、村の生活が成り立っているようなイメージです。

承知いたしました。歯車を「廃墟の残骸」から「生活の動力源」へと役割を変えるプロンプトに進化させましょう。歯車を「水車」として、具体的な「機能」を記述します。

プロンプトでは、「wooden watermill, grinding wheat for the villagers(村人のために小麦を挽く水車)」や、「a woman hangs laundry, a man fishes from a small boat(女性が洗濯物を干し、男性が小舟から釣りをする)」といった、具体的な生活の動詞を組み込みます。
🛠️ 試行3:歯車を実際に利用している村の風景
| 項目 | 設定値 |
| テーマ | 歯車を実際に利用して人々が暮らしに取り入れている風景 |
| ポジティブプロンプト | A breathtaking Studio Ghibli-style image of a vibrant village built around a massive, functional water channel and an ancient, slow-turning rusty gear. The gear is the central power source, with a smaller gear wheel attached to a wooden watermill, grinding wheat for the villagers. Homes and small shops... People... a woman hangs laundry, a man fishes from a small boat, and children play near the gear, treating it as a natural part of their world. The overall mood is one of rustic tranquility and resourceful living. |
| ネガティブプロンプト | (painting, drawing, illustration, cartoon, anime, 3d, sketch:1.5), blurry, low quality, deformed, ugly, flat lighting, smooth surface, plastic, clean. |
| Automatic1111設定 | Steps: 30, Sampler: DPM++ 2M SDE Karras, CFG Scale: 5, Resolution: 896x1152 |
AI: 生成された画像は、生活の動詞が加わり、より人々の暮らしが感じられる作品になりました。



素晴らしいです。これをさらに進化させて、巨大で無機質な歯車が密集し、鉄鋼業に特化したような複雑なシステムが支配する街並みに挑戦したいです。ラピュタの世界観から一転、スチームパンクの産業時代へ舵を切ります!

「静かな田舎の動力」から「轟音を立てる産業の心臓部」へですね!ここでは、「複雑さ」と「圧倒的な工業力」を強調します。プロンプトで歯車を「maze of massive, interlocking brass and copper gears」として描写し、工業の活気と火の光を強調します。
🛠️ 試行4:鉄鋼業に特化したスチームパンクの街並み
| 項目 | 設定値 |
| テーマ | 歯車を密集させて鉄鋼業に特化したような複雑なシステムの街並み |
| ポジティブプロンプト | A sprawling, steampunk cityscape dedicated to the steel industry. The city is an intricate maze of massive, interlocking brass and copper gears... Towering smokestacks... Below, the city glows with the fiery activity of countless foundries, where molten metal spills and sparks illuminate the dark, grimy streets... The overall atmosphere is one of overwhelming industrial power and intricate, bustling functionality. |
| ネガティブプロンプト | (painting, drawing, illustration, cartoon, anime, 3d, sketch:1.5), blurry, low quality, deformed, ugly, flat lighting, smooth surface, plastic, clean. |
| Automatic1111設定 | Steps: 30, Sampler: DPM++ 2M SDE Karras, CFG Scale: 5, Resolution: 896x1152 |
AI: 生成された画像は、炎と煙に満ちた、重厚な作品となりました。


第3章:歴史と時代の深度 — ヴィクトリア朝への昇華

迫力がありますね。もう少し「街中」の風景に近づけて、産業革命期、ヴィクトリア期、パックス・ブリタニカといった具体的な時代背景を加えて、リアリティを深められますか?

承知いたしました!AIに「時代考証」をさせるプロンプトに挑戦します。
「Victorian-era buildings」や「period attire - top hats, waistcoats, and goggles」といった、人や建築の具体的なディテールを加え、「gaslamp-lit sky」(ガス灯に照らされた空)で光の質も指定することで、時代性を強く打ち出します。
🛠️ 試行5:ヴィクトリア朝の時代背景を加えた街並み
| 項目 | 設定値 |
| テーマ | スチームパンクの要素で産業革命期、ヴィクトリア期、パックスブリタニカの時代背景 |
| ポジティブプロンプト | A breathtaking, highly detailed, cinematic, victorian steampunk cityscape. The city's foundations... are a dense, intricate network of colossal, interlocking brass and copper gears... Towering smokestacks, built from riveted steel and weathered brick, release thick plumes of dark smoke into a hazy, gaslamp-lit sky. Majestic, ornate Victorian-era buildings... The scene is bustling with life, with tiny figures of workers in period attire---top hats, waistcoats, and goggles... reminiscent of the Pax Britannica era. |
| ネガティブプロンプト | (painting, drawing, illustration, cartoon, anime, 3d, sketch:1.5), blurry, low quality, deformed, ugly, flat lighting, smooth surface, plastic, clean. |
| Automatic1111設定 | Steps: 30, Sampler: DPM++ 2M SDE Karras, CFG Scale: 5, Resolution: 896x1152 |

生成された画像がこちらです。人々の服装やガス灯の暖かな光が、「パックス・ブリタニカ」という時代の空気感をリアルに表現してくれました。



第4章:究極のシンボル — 巨大時計と宮崎駿デザインの融合

素晴らしいですね。この街の風景をさらにダイナミックにしたいです!街中の風景でありながら、「歯車産業のシンボル」として機能しているような構図をお願いします。具体的には、巨大な街中の時計が複雑な歯車を剥き出しにしたデザインで、広場の真ん中に佇んでいるような絵です。

「ダイナミックな構図」と「シンボルとしての機能美」の融合ですね!巨大な時計を配置し、人々がその巨大な機構の周りで日常を送る情景を描写します。
🛠️ 試行6:街のシンボルとしての巨大時計(初期案)
| 項目 | 設定値 |
| テーマ | 街の広場にある、複雑な歯車でできた巨大な時計 |
| ポジティブプロンプト | The centerpiece of a bustling city square is a colossal clock tower with a massively intricate, exposed gear mechanism. The clock face is surrounded by a dense network of interlocking brass and copper gears that visibly turn... The city square below is filled with people in period attire, going about their daily lives... Airships... where gears are the city's proudest feature. |
| ネガティブプロンプト | (painting, drawing, illustration, cartoon, anime, 3d, sketch:1.5), blurry, low quality, deformed, ugly, flat lighting, smooth surface, plastic, clean. |
| Automatic1111設定 | Steps: 30, Sampler: DPM++ 2M SDE Karras, CFG Scale: 5, Resolution: 896x1152 |
AI: 生成された画像がこちらです。非常にダイナミックな作品となりました。



感動的です!この巨大時計のデザインを、最後に宮崎駿氏が汐留にデザインしたような、もっと複雑で非対称的な構造に近づけたいです。国会議事堂のような整った建築ではなく、有機的に成長したようなデザインです。

承知いたしました。非対称で生命感あふれる複雑なデザインを再現するため、「non-symmetrical」や「organically grown」といった、デザイン性を強調するキーワードを指示します。
🛠️ 試行7:宮崎駿デザインの複雑さを加えた最終プロンプト
| 項目 | 設定値 |
| テーマ | 汐留にある宮崎駿デザインの大時計のイメージで複雑さを加える |
| ポジティブプロンプト | The clock is a whimsical, fantastical design, made of weathered brass and aged copper, with numerous clockwork figures and small, ramshackle houses integrated into the design. The overall structure is non-symmetrical and looks organically grown, with overlapping platforms and pipes. It resembles a fantastical mechanical puppet show. |
| ネガティブプロンプト | (painting, drawing, illustration, cartoon, anime, 3d, sketch:1.5), blurry, low quality, deformed, ugly, flat lighting, smooth surface, plastic, clean. |
| Automatic1111設定 | Steps: 30, Sampler: DPM++ 2M SDE Karras, CFG Scale: 5, Resolution: 896x1152 |

この最終プロンプトで生成された、今回の旅のクライマックスを飾る作品がこちらです。


第5章:知識の統合 — 傑作を生むための戦略

今回の旅で得られた教訓は、「リアルな土台の上に、言葉でファンタジーというルールを上書きする」ことの重要性です。

なぜ、リアルなモデルで、ファンタジーがうまくいくんでしょうか?

それは、AIの学習メカニズムによるものです。
- リアルな質感の応用:
CyberRealistic XLは、物質(マテリアル)の表現が極めてリアルです。
そのため、「巨大時計」という非現実的なオブジェクトを指示しても、その表面の「青銅の質感」や「経年劣化した銅の色」を忠実に再現しようとします。
ファンタジーの「説得力」は、リアリティのあるディテールから生まれるのです。 - プロンプトによる「スタイル」の上書き:
私たちは「Studio Ghibli-style」や「whimsical, fantastical design」といったスタイルキーワードを積極的に使いました。
これにより、AIはベースモデルが持つリアリズムの能力を、「ファンタジーのルール」に従って適用するようになります。
リアルな画材を使ってファンタジーの絵を描くようなイメージですね。

今回の成功から学んだ、最高の画像を生み出すための戦略をまとめますね。
| 鍵となる要素 | プロンプトでの実践例 | 初心者への解説 |
| 1. 意図的な文脈(物語性)の付与 | "Synth-Noodles"や"ramshackle houses"など、生活の痕跡や地名といった具体的なディテールを加える。 | 被写体だけでなく、その周囲の「空気」や「歴史」を描写しましょう。 これにより、AIが勝手に物語を作ってくれます。 |
| 2. スタイルと言葉の融合 | "Studio Ghibli-style"や"whimsical, fantastical design"といったスタイルキーワードを、"exposed gear mechanism"(剥き出しの歯車)というモチーフと組み合わせる。 | 「何を」描くかだけでなく「誰の絵のように」描くかを明確にすることで、作品の方向性を決定づけることができます。 |
| 3. 機能と役割の強調 | "interlocking brass and copper gears that visibly turn with a sense of immense power and purpose"(巨大な力と目的を持って目に見えて回転する)といった、動詞や役割を明確に記述する。 | 被写体の「動作」や「機能」を具体的に指示しましょう。 これにより、単なる静物ではなく、生命感のある主役として描写されます。 |
第6章:ステップアップ — 次の創作への戦略的提言

最後に、今回の経験を元に、あなたが次にAIアートを制作する際に役立つ、より高度なステップアップのための戦略を提案させてください。

ぜひお願いします!プロンプトのテクニックだけでなく、創造性を高めるヒントがほしいです。

承知いたしました!次の創作活動で、より深く、よりユニークな表現を目指すための3つの提言です。
1. 「質感」の表現を突き詰める

今回、金属のリアルさに驚かれましたが、次に挑戦していただきたいのは、この「物質の表現力」を他のマテリアルに応用することです。例えば、「布地の編み方や重さ」を指定することで、その布特有の美しいドレープやリアルなシワを再現できます 。
プロンプトに「lightweight modal jersey fabric(軽量モーダルジャージー)」といった、布地の種類を具体的に加えてみましょう。
2. 「カメラアングルと視点」で感情を操作する

最終的な「巨大時計」の画像は、ローアングル(low-angle lighting)を使うことで、その巨大さや威圧感を強調することができました。
次の作品では、アングルを意識的に操作して、鑑賞者の感情をコントロールしてみましょう。
- アオリ構図(ローアングル):
キャラクターを威圧的、または英雄的に見せたいときに使用します。 - フカン構図(ハイアングル):
キャラクターを孤独、無力、あるいは可愛らしく見せたいときに使用します。
3. 「コンセプトの融合」を意図的に行う

次は、意図的に異なる概念を組み合わせるテクニックに挑戦してみましょう。
例えば、プロンプトスケジューリングの応用として、[apple:fire:0.4]のように、生成の途中でプロンプトを切り替える構文を使うことで、「燃えるリンゴ」のようにこの世に存在しない超現実的なオブジェクトを創造できます。
これは、静止画の中に「変容の過程」を閉じ込める高度なテクニックです。

これらの戦略的なアプローチは、あなたのAIアートを単なる「生成」から「意図的な創作」へと進化させる手助けになるはずです。
次のアイデアでも、プロンプトの可能性を一緒に広げていきましょう!
まとめ
今回は「歯車が織りなす世界」というテーマに挑戦し、さまざまなアイデアを巡りながら、最終的に街のシンボルとしての巨大な時計塔を描くことができました。
AI画像生成は、プロンプトという言葉一つで、時に予想外の、そして感動的な物語を生み出してくれる、まるで魔法のような体験です。今回の記事が、皆さんの創作活動のヒントになれば幸いです。
皆さんもぜひ、様々なプロンプトとチェックポイントを組み合わせて、あなただけの「世界」を創造してみてくださいね!
