要旨
本報告書は、Stable Diffusion XL (SDXL) アーキテクチャを基盤とするフォトリアリスティック生成モデル「CyberRealistic XL v8.0」に関する包括的な技術分析および運用ガイドラインである。Generative AIの進化において、v8.0は「解剖学的整合性」と「テクスチャの忠実度」に重点を置いた重要なマイルストーンとして位置づけられる。本調査では、モデルの内部アーキテクチャの変遷、特にv7からv8への移行における四肢生成の安定化プロセスを分析し、DPM++ 3M SDE KarrasサンプラーやComfyUIを用いた高度なワークフロー(Detail Daemon、Perturbed Attention Guidance等)による画質向上のメカニズムを解明する。
さらに、トレンド分析を通じて、現在のアナログ写真模倣の潮流やPony Diffusion系モデルとの市場における棲み分けを明らかにする。事例研究として、アニメーション作品『新世紀エヴァンゲリオン』のキャラクター「綾波レイ」を取り上げ、二次元的特徴(青い髪、赤い瞳、プラグスーツ)をフォトリアリズムの物理法則に適合させるための高度なプロンプトエンジニアリング手法を提示する。本報告書は、プロフェッショナルなテクニカルアーティストおよびAI研究者を対象とし、理論的背景と実践的応用を融合させた決定的な資料となることを目的としている。
- 0.1. 要旨
- 1. 1. 序論:CyberRealistic XLの系譜と設計思想
- 1.1. 1.1 SDXLアーキテクチャとファインチューニングの力学
- 1.2. 1.2 バージョン8.0におけるパラダイムシフト:解剖学的厳密性
- 1.3. 1.3 フォトリアリズムの定義とモデルの市場ポジショニング
- 2. 2. 技術的構成と推奨パラメータの理論的背景
- 2.1. 2.1 サンプリングアルゴリズムの選定と数理的根拠
- 2.2. 2.2 解像度戦略と潜在空間の挙動
- 2.3. 2.3 CFGスケールとガイダンスの相互作用
- 3. 3. 高度なワークフロー統合:ComfyUIを中心として
- 3.1. 3.1 2パス・レイテントアップスケール法
- 3.2. 3.2 テクスチャ生成の深化:Detail DaemonとLying Sigma
- 3.3. 3.3 FreeU v2およびPerturbed Attention Guidance (PAG) の適用
- 3.4. 3.4 顔面補正パイプラインの構築
- 4. 4. 画質向上のためのアップスケーリング戦略
- 4.1. 4.1 推奨アップスケーラーの特性分析
- 4.2. 4.2 GANによる細部幻覚と写真粒子の保存
- 5. 5. トレンド分析と比較評価
- 5.1. 5.1 アナログ・ルネサンス:フィルムシミュレーションの流行
- 5.2. 5.2 Pony Diffusion系モデルとのリアリズム比較
- 5.3. 5.3 「Candid」対「Studio」:照明と構図のトレンド
- 6. 6. 事例研究:綾波レイのフォトリアリスティック再現
- 6.1. 6.1 キャラクター記号の物理的翻訳
- 6.2. 6.2 色彩理論の衝突と解決:青い髪と赤い瞳
- 6.3. 6.3 プラグスーツの質感表現とマテリアル設定
- 6.4. 6.4 最適化されたプロンプト構築と実例
- 6.4.1. シナリオA:コクピット内の緊迫感(Cinematic Realism)
- 6.4.2. シナリオB:日常の憂鬱(Candid/Analog Style)
- 7. 7. ネガティブプロンプトとEmbeddingの戦略的運用
- 7.1. 7.1 否定形の意味論とSDXLの挙動
- 7.2. 7.2 CyberRealistic Negative Embeddingの効果測定
- 8. 8. 結論と今後の展望
- 9. 引用文献
目次
- 序論:CyberRealistic XLの系譜と設計思想
- 1.1 SDXLアーキテクチャとファインチューニングの力学
- 1.2 バージョン8.0におけるパラダイムシフト:解剖学的厳密性
- 1.3 フォトリアリズムの定義とモデルの市場ポジショニング
- 技術的構成と推奨パラメータの理論的背景
- 2.1 サンプリングアルゴリズムの選定と数理的根拠
- 2.2 解像度戦略と潜在空間の挙動
- 2.3 CFGスケールとガイダンスの相互作用
- 高度なワークフロー統合:ComfyUIを中心として
- 3.1 2パス・レイテントアップスケール法
- 3.2 テクスチャ生成の深化:Detail DaemonとLying Sigma
- 3.3 FreeU v2およびPerturbed Attention Guidance (PAG) の適用
- 3.4 顔面補正パイプラインの構築
- 画質向上のためのアップスケーリング戦略
- 4.1 推奨アップスケーラーの特性分析
- 4.2 GANによる細部幻覚と写真粒子の保存
- トレンド分析と比較評価
- 5.1 アナログ・ルネサンス:フィルムシミュレーションの流行
- 5.2 Pony Diffusion系モデルとのリアリズム比較
- 5.3 「Candid」対「Studio」:照明と構図のトレンド
- 事例研究:綾波レイのフォトリアリスティック再現
- 6.1 キャラクター記号の物理的翻訳
- 6.2 色彩理論の衝突と解決:青い髪と赤い瞳
- 6.3 プラグスーツの質感表現とマテリアル設定
- 6.4 最適化されたプロンプト構築と実例
- ネガティブプロンプトとEmbeddingの戦略的運用
- 7.1 否定形の意味論とSDXLの挙動
- 7.2 CyberRealistic Negative Embeddingの効果測定
- 結論と今後の展望
1. 序論:CyberRealistic XLの系譜と設計思想
1.1 SDXLアーキテクチャとファインチューニングの力学
CyberRealistic XLは、Stability AIが開発したStable Diffusion XL 1.0 (SDXL) を基盤モデルとして採用している 1。SDXLは、従来のSD1.5系モデルと比較して約3倍のパラメータ数(2.6BのUNet)を持ち、二つのテキストエンコーダ(OpenCLIP ViT-bigG/14 および CLIP ViT-L/14)を並列して使用することで、プロンプトの理解度と画像生成の忠実度を飛躍的に向上させている。
CyberRealistic XLの開発者であるCyberdeliaは、この強力な基盤モデルに対し、特定方向への徹底的なファインチューニングを施している。その主要な目的は「フォトリアリズムの極致」であり、AI生成特有のプラスチックのような質感("plastic skin")や、不自然に滑らかな照明効果を排除することにある 3。このプロセスには、大量の高解像度写真データセットを用いた追加学習が含まれ、特に肌のキメ(pores)、微細な産毛、照明の物理的な減衰(falloff)などの表現力が強化されている。
1.2 バージョン8.0におけるパラダイムシフト:解剖学的厳密性
バージョン8.0(v8.0)へのアップデートは、単なる画質の向上に留まらず、生成モデルの根本的な課題である「解剖学的整合性」への挑戦を含んでいる。拡散モデル(Diffusion Models)は確率論的にピクセルを配置するため、四肢の数や指の形状といった構造的な論理性を維持することが本質的に困難である。
調査資料によると、v8.0の開発目標は「境界をさらに押し広げる」ことにあり、具体的には「予期せぬ余分な四肢(surprise extra limbs)」の大幅な抑制が図られている 4。開発者は「2本の腕と片手5本の指を一貫して維持する」ことを強調しており、これは学習データセットにおいて、解剖学的に正確な画像への重み付けを強化し、逆に奇形を含む生成結果に対するペナルティ(Negative Reinforcement)を与えたことを示唆している。これにより、v8.0は「肘なのか現代アートなのか判別不能な瞬間」を排除し、信頼性の高い人物描画能力を獲得している 4。
1.3 フォトリアリズムの定義とモデルの市場ポジショニング
「フォトリアリズム」と一口に言っても、その方向性は多岐にわたる。市場には「Juggernaut XL」や「RealVisXL」といった競合モデルが存在するが、CyberRealistic XLのポジショニングは「Cinematic(映画的)」かつ「Raw(未加工)」な質感にあると分析される 5。
- Juggernaut XL: ストックフォトのような、均整の取れた商業的なリアリズム。
- CyberRealistic XL: フィルムグレイン、微細な肌の凹凸、ドラマチックな陰影を含む、より「生々しい」リアリズム。
ユーザーレビューやコミュニティの反応 5 を分析すると、CyberRealistic XLは複雑なプロンプトエンジニアリング(呪文の羅列)を必要とせず、シンプルな自然言語で高品質な写真を出力できる点が高く評価されている 7。これは、SDXLのデュアルエンコーダの利点を活かしつつ、トリガーワードへの依存度を下げた調整が行われていることを意味する。
2. 技術的構成と推奨パラメータの理論的背景
CyberRealistic XL v8.0の性能を最大限に引き出すためには、モデルの学習過程で前提とされたノイズスケジュールに合致したパラメータ設定が不可欠である。不適切な設定は、テクスチャの欠損や構図の崩壊を招く。
2.1 サンプリングアルゴリズムの選定と数理的根拠
推奨設定において最も注目すべき点は、サンプラーの選定である。CyberRealistic XLでは、以下のサンプラーが推奨されている 2。
| 推奨サンプラー | 特性分類 | 技術的根拠と推奨理由 |
|---|---|---|
| DPM++ 3M SDE Karras | 確率微分方程式 (SDE) 高次ソルバー | [最高推奨] "3M"は高次の近似を行い、"SDE"は各ステップでノイズを注入する。 このノイズ注入プロセスが、モデルが学習した「肌の微細なノイズ(毛穴やキメ)」を励起し、圧倒的なディテールを生み出す。 決定論的ソルバー(ODE)と比較して、生物的な質感表現に優れる。 |
| Euler A | 祖先サンプリング (Ancestral) | 高速かつ安定しているが、DPM++系に比べると全体的にソフトでドリーミーな画質になりやすい。 構図の確認や、柔らかいポートレート表現に適している。 |
| DPM++ 2M Karras | 常微分方程式 (ODE) ソルバー | 収束が早くクリーンな画像が得られるが、SDEのようなノイズ注入がないため、 肌の質感が「つるっとした」プラスチック調になりやすいリスクがある。 |
推奨ステップ数:25〜30
SDXLベースのモデルは収束が早いため、過剰なステップ数は不要である。30ステップを超えると、ディテールの改善効果が逓減するだけでなく、コントラストが過剰になり画像が「焼けた」ような状態になる可能性がある 2。
2.2 解像度戦略と潜在空間の挙動
SDXLは1024x1024ピクセルでの生成を前提に学習されている(Native Resolution)。したがって、512x512などの低解像度で生成すると、モデルは対象物が遠くにあると誤認したり、情報の圧縮率が合わずに画像が崩壊したりする 2。
- 基本解像度: 1024x1024 (1:1), 896x1152 (ポートレート), 1216x832 (ランドスケープ)
- Hires.fix(高解像度化): 1.5倍〜2.0倍(例:1536x1536)
推奨設定では、Hires.fixを使用する際の解像度として1536x1536が挙げられている 2。これは、ピクセル空間での単純拡大ではなく、Latent(潜在)空間での再サンプリングを伴うことで、細部の描き込み(Hallucination)を促進するためである。
2.3 CFGスケールとガイダンスの相互作用
推奨値:7.0 〜 8.0 2
多くのSDXLモデルがCFGスケール 4.0〜6.0 という低めの値を推奨する中で、CyberRealistic XLは比較的高めの 7.0〜8.0 を推奨している。
CFGスケール(Classifier-Free Guidance Scale)は、プロンプトへの忠実度と画像の多様性のバランスを制御するパラメータである。値が高いほどプロンプトに従おうとする力が強くなる。CyberRealistic XLが高いCFGを許容(あるいは要求)するということは、モデルが過学習による「焼き付き」に対する耐性を持っており、強いガイダンスを与えることで、学習された「フォトリアリスティックな特徴量」を強制的に発現させる必要があることを示唆している。
3. 高度なワークフロー統合:ComfyUIを中心として
Automatic1111などのWebUIでも生成は可能だが、CyberRealistic XL v8.0の真価を発揮するためには、ノードベースのUIであるComfyUIを用いた複雑なパイプライン構築が推奨される。特に、テクスチャの極限化と顔面の修正には、高度なカスタムノードの利用が不可欠である。
3.1 2パス・レイテントアップスケール法
最高品質の画像を生成するための標準的な手法として「2パス生成」が挙げられる 8。
- First Pass (Base Generation):
- 通常のテキスト・トゥ・イメージ生成を行う。解像度はネイティブ(1024x1024等)。
- この段階では構図とポーズの確定が目的であり、細部は粗くても良い。
- Latent Upscaling:
- 生成されたLatent(潜在変数)をデコードせずに直接拡大する。推奨倍率は1.3倍〜1.5倍。
- ピクセル空間での拡大よりも計算コストが低く、情報の連続性が保たれる。
- Second Pass (Refinement):
- 拡大されたLatentに対して、低いDenoise強度(0.3〜0.5)で再度サンプリングを行う(Image-to-Image)。
- ここでCyberRealistic XLの微細なテクスチャ生成能力が発揮され、拡大によって生じた間隙に新たなディテール(皮膚の凹凸、布の繊維)が書き込まれる。
3.2 テクスチャ生成の深化:Detail DaemonとLying Sigma
調査資料において、ComfyUIユーザーの間で注目されているのがDetail Daemonノードの活用である 9。
- Detail Daemon Sampler:
- 機能: サンプリングプロセス中の「シグマ(ノイズレベル)」を動的に調整する。具体的には、各ステップで除去されるノイズの量を微調整し、意図的にノイズ(=ディテール)を残存させる。
- 設定: detail_amount を 0.1〜0.3 程度に設定する。0.5を超えると画像が崩壊するリスクがある。
- 効果: 通常のサンプリングでは平滑化されてしまうような、極めて微細な高周波成分(肌の質感や背景の塵)が強調される。
- Lying Sigma Sampler:
- Detail Daemonの簡易版とも言える手法で、シグマの開始点(Start)と終了点(End)を指定して適用範囲を限定する。例えば、生成の後半(End 0.7〜1.0)のみに適用することで、構図を変えずに表面の質感だけを「ザラつかせる」ことが可能になる 10。
3.3 FreeU v2およびPerturbed Attention Guidance (PAG) の適用
SDXLのアーキテクチャ上の特性を利用した画質向上手法も有効である。
- FreeU v2:
- U-Netのバックボーン特徴量とスキップ接続特徴量のバランスを調整する手法。
- 設定: SDXL向けの標準的な設定(b1: 1.1-1.2, b2: 1.2-1.4, s1: 0.9, s2: 0.2)が推奨されるが、CyberRealistic XLにおいてはデフォルト値(すべて1.0)付近でも効果が見込める 13。過度な適用はコントラスト過多を招くため注意が必要。
- Perturbed Attention Guidance (PAG):
- Self-Attention(自己注意機構)層に摂動を与えることで、構造的な整合性を高める手法 15。CFGスケールを補完する役割を果たし、低いCFG値でもプロンプトの反映度を高めることができるため、より自然なトーンレンジを維持できる。
3.4 顔面補正パイプラインの構築
「綾波レイ」のようなキャラクター生成において、顔の崩れは致命的である。Face Detailer(ComfyUI Impact Pack等のSEGS機能を利用)の組み込みは必須である 16。
- プロセス:
- BBOX Detector: 画像から顔の領域を検出する。
- SAM (Segment Anything Model): 検出ボックス内から、顔の正確なマスク(輪郭)を生成する。
- Detailer Pass: マスクされた領域のみを高解像度で再生成(Inpainting)する。
- CyberRealistic XL向けの調整:
- Denoise強度は 0.25〜0.35 に抑える。高すぎると、元の顔の印象(綾波レイとしての特徴)が失われ、汎用的な「美女」の顔に書き換えられてしまう。
- Mask Blur: 境界線を目立たなくするために必須。
4. 画質向上のためのアップスケーリング戦略
最終的な出力画像のクオリティ、特に「写真らしさ」を決定づけるのはアップスケーラーの選択である。CyberRealistic XLの推奨設定は、一般的なアニメ向けモデルとは明確に異なる。
4.1 推奨アップスケーラーの特性分析
公式ドキュメントおよびユーザー調査により、以下の2つのアップスケーラーが推奨されている 2。
| アップスケーラー名 | 特性・メカニズム | CyberRealistic XLでの役割 |
|---|---|---|
| 4x_NMKD-Siax_200k | 写真データセットで学習されたESRGANモデル。 ノイズやフィルムグレインを「ノイズ」として除去せず、 「ディテール」として保存・強調する特性がある。 | [最重要] 肌の質感、コンクリートの表面、布地の繊維などを拡大時に「描き足す」能力が高い。 プラスチック感を消すために必須。 |
| 4x_NickelbackFS_72000_G | 詳細なテクスチャ保持とシャープネスのバランスが良いモデル。 | Siaxよりもややシャープな仕上がりになる。 硬質な物体(メカ、プラグスーツ)の表現に適している。 |
4.2 GANによる細部幻覚と写真粒子の保存
従来のアニメ系アップスケーラー(R-ESRGAN 4x+ Anime6Bなど)は、線を滑らかにし、ノイズを除去する方向に働く。しかし、フォトリアリズムにおいて「ノイズの欠如」は「不自然さ」に直結する。
推奨される NMKD-Siax は、元の画像に存在しない高周波情報(微細なノイズ)を幻覚的に生成(Hallucination)することで、拡大しても間延びしない密度感を提供する。これは、CyberRealistic XL v8.0が目指す「未加工の写真(RAW photo)」の美学と合致する。設定時には、Hires.fixのDenoise Strengthを 0.3〜0.4 程度に設定し、アップスケーラーが適度にディテールを追加できる余地を与えることが重要である。
5. トレンド分析と比較評価
CyberRealistic XL v8.0は孤立した存在ではなく、AIアートコミュニティのトレンドの中で評価されるべきである。
5.1 アナログ・ルネサンス:フィルムシミュレーションの流行
現在、CivitaiやReddit等のコミュニティでは、デジタル的な鮮明さを忌避し、アナログ写真の不完全性を模倣するトレンドが支配的である 5。
CyberRealistic XLのユーザーは、以下のようなプロンプトを多用している。
- フィルムストック: Kodak Portra 400, Fujifilm XT-4, 35mm film, Cinestill 800T
- 光学的欠陥: film grain (粒子), light leaks (光漏れ), chromatic aberration (色収差), motion blur (被写体ブレ)
- 撮影スタイル: candid (スナップショット), amateur photo (素人撮影), polaroid
v8.0はこれらのプロンプトに対する反応性が高く、SDEサンプラーと組み合わせることで、本物のフィルム写真のようなザラつきや、ピントの甘さを意図的に再現できる点が評価されている。
5.2 Pony Diffusion系モデルとのリアリズム比較
現在、SDXLエコシステムを席巻しているのが「Pony Diffusion V6」派生のモデル群である。Pony系モデルでもリアリズムを追求したモデル(CyberRealistic Pony等)が存在するが、本家CyberRealistic XLとはアプローチが異なる 6。
- Pony系リアリズム:
- 制御方法: score_9, source_photo, rating_safe といった特殊なスコアリングタグを使用する。
- 長所: 複雑なポーズやシチュエーション(特にNSFWや特定のアクション)の再現性が高い。プロンプト従順性が最強。
- 短所: 画質がどこか「CG的」であり、肌の質感やライティングの自然さではCyberRealistic XLに劣る場合がある。
- CyberRealistic XL v8.0:
- 制御方法: 自然言語プロンプト(realistic, photo of...)。
- 長所: 圧倒的なテクスチャの質感、空気感、映画的なライティング。
- 短所: Ponyほど極端なポーズ指定や概念の混合には弱く、プロンプト解釈がやや厳格。
結論として、「ポーズや状況の正確さ」を求めるならPony系、「写真としての説得力と質感」を求めるならCyberRealistic XL v8.0が選ばれている 6。
5.3 「Candid」対「Studio」:照明と構図のトレンド
初期のAIフォトリアリズムは、完璧なライティングの「スタジオポートレート」が主流であったが、現在は「Candid(ありのままの、盗撮風の)」スタイルへの移行が見られる。
CyberRealistic XL v8.0は、フラッシュの直射による硬い影や、逆光によるフレアなど、照明の不完全さを許容するプロンプト(flash photography, harsh lighting, dimly lit)に対して非常に良い結果を出す。これにより、「AIで作った完璧すぎる画像」という違和感を払拭しようとするユーザー層に支持されている 2。
6. 事例研究:綾波レイのフォトリアリスティック再現
本セクションでは、アニメキャラクターである「綾波レイ」を、CyberRealistic XL v8.0を用いて、まるで実在する人物かのように描画するための具体的な方法論を展開する。
6.1 キャラクター記号の物理的翻訳
2次元のキャラクターを3次元のフォトリアリズムに落とし込む際、最大の障壁となるのは「記号の翻訳」である。アニメにおける記号的表現を、物理的な素材や現象として再定義する必要がある。
| アニメ的特徴 | フォトリアリスティックな翻訳 (プロンプト要素) | 理由・狙い |
|---|---|---|
| 青い髪 | pale blue hair, dyed hair, platinum blue hair, textured hair | 単に"blue hair"とすると、アニメ塗りのベタっとした青になりやすい。 「染めた髪」「質感のある髪」と定義することで、光の反射や毛先の透け感を表現させる 21。 |
| 赤い瞳 | red iris, albino traits, translucent eyes, depth in eyes | 「赤い目」は現実離れしているため、アルビノの特徴や、光を透過するガラスのような質感を指定し、 コンタクトレンズや遺伝的特徴としての説得力を持たせる 22。 |
| プラグスーツ | white latex bodysuit, glossy finish, mechanical details, green neon lights, armored parts | アニメのスーツを「ラバー」や「ラテックス」、「硬質プラスチック」などの具体的な素材名で記述し、 表面の反射率(Specularity)をモデルに理解させる 23。 |
| 無表情 | melancholic expression, stoic, subtle emotion, neutral face | "Expressionless"(無表情)とすると能面のようになるため、 「憂鬱」「ストイック」といった感情のニュアンスを含めることで、人間味のある静けさを表現する。 |
6.2 色彩理論の衝突と解決:青い髪と赤い瞳
フォトリアリズムにおいて「青い髪と赤い目」は、モデルが持つ「人間の顔」の学習データ(黒・茶・金髪、茶・青・緑目)と衝突する。SDXLはこれを「コスプレ」または「アニメ絵」と判断し、画風をイラスト調に引き戻そうとするバイアスが働く 23。
これを防ぐためには、プロンプトの重み付けと素材指定が鍵となる。
- (pale blue hair:1.2) のように色指定を強調しつつ、同時に (hyperrealistic:1.4) や (raw photo:1.3) で画風を写真に強く固定する。
- 髪色を「淡い(Pale)」や「銀に近い(Silvery)」方向に調整することで、現実の照明環境下での整合性を高める。
6.3 プラグスーツの質感表現とマテリアル設定
綾波レイの白いプラグスーツは、CyberRealistic XL v8.0のテクスチャ表現力が試される部分である。単に plugsuit と入力すると、ボディペイントのような平坦な質感になりがちである。
調査資料およびトレンド分析に基づき、以下の修飾語が有効である 24。
- 素材感: latex(ラテックス), shiny(光沢), rubber(ゴム), scifi armor(SFアーマー)。
- 構造: intricate mechanical details(複雑な機械的詳細), padded(パッド入りの), seams(継ぎ目)。
- アクセント: glowing green accents(発光する緑のアクセント)を指定し、ライティング効果として反映させる。
6.4 最適化されたプロンプト構築と実例
以下に、CyberRealistic XL v8.0に最適化された、2つの異なるシチュエーションのプロンプト例を提示する。
シナリオA:コクピット内の緊迫感(Cinematic Realism)
映画のワンシーンのような、高精細でドラマチックな描写を目指す。
Positive Prompt:
(Masterpiece, best quality, photorealistic:1.3), raw photo, 8k uhd, dslr, soft lighting, high quality, film grain, Fujifilm XT3,
Subject: 1girl, Ayanami Rei, (realistic style:1.4), looking at viewer, intense gaze, (translucent red eyes:1.2), (pale blue short bob hair:1.2), fine hair texture, messy bangs, pale porcelain skin, (detailed skin texture:1.3), pores, faint veins, sweat on skin,
Outfit: (white latex Evangelion plugsuit:1.3), glossy surface, reflection, intricate mechanical details, armored interface clips on head, glowing green neon accents, tight fit,
Background: inside dark sci-fi cockpit, biomechanical interior, LCL liquid bubbles, moody lighting, rim light, shadows, depth of field, bokeh, 85mm lens.
Negative Prompt:
(Anime:1.5), (cartoon:1.5), (illustration:1.5), (3d render:1.3), drawing, sketch, painting, digital art, semi-realistic, cgi, plastic skin, doll, mannequin, cosplay, bad anatomy, extra limbs, missing fingers, floating limbs, disconnected body, blurred, low quality, oversaturated, cel shading, thick outlines, flat color.


解説:
- (realistic style:1.4) と (Anime:1.5) の対比により、モデルのアニメバイアスを強力に抑制している。
- sweat on skin, pores を加えることで、DPM++ 3M SDEサンプラーが肌の質感を生成する「取っ掛かり」を作っている。
- 背景を暗くし rim light(半逆光)を指定することで、プラグスーツの輪郭と髪の透け感を際立たせる。
シナリオB:日常の憂鬱(Candid/Analog Style)
学校の教室で佇む、より「人間くさい」綾波レイを描く。
Positive Prompt:
Analog film photo, Polaroid style, candid shot, 1girl, Ayanami Rei, (school uniform:1.2), white shirt, blue pinafore dress, red ribbon, bandages on arm, arm cast,
Features: short light blue hair, messy hair, red eyes, pale skin, albino girl, natural lighting, sunlight through window, window shadow, standing in a japanese classroom, dust particles,
Camera: soft focus, film grain, Kodak Portra 400, 35mm, motion blur, slightly out of focus background,
Expression: subtle smile, melancholic, lonely, looking away.
Negative Prompt:
Anime, vibrant colors, makeup, lipstick, jewelry, 3d render, cgi, unnatural lighting, studio lights, retouching, airbrushed, smooth skin, cartoon, illustration, perfect face, symmetry.


解説:
- bandages(包帯)や arm cast(ギプス)はレイの象徴的要素であり、リアリズムにおいては「痛々しさ」としてのリアリティを付与する。
- Kodak Portra 400 を指定することで、少し色あせた、ノスタルジックな色調を誘導する。
7. ネガティブプロンプトとEmbeddingの戦略的運用
SDXLはSD1.5に比べてネガティブプロンプトへの依存度は低いとされるが、CyberRealistic XLにおいては、特定のアートスタイルを排除するために依然として重要である。
7.1 否定形の意味論とSDXLの挙動
調査によれば、最も強力なネガティブワードは anime である 19。これを入力するだけで、モデルは学習データ内の膨大な「アニメ絵」のクラスタから距離を置き、写真データセットの領域へと推論をシフトさせる。
また、3d render, cgi も重要である。これらを否定しない場合、CyberRealistic XLは「リアルだがゲームのような(マネキンのような)」画像を生成してしまう傾向がある。
推奨ネガティブワード群: 26
- 画風排除: anime, cartoon, painting, illustration, drawing, sketch, digital art
- 質感排除: 3d render, cgi, plastic, doll, mannequin, airbrushed, smooth skin
- 品質排除: blurry, low quality, bad anatomy, watermark, text, signature
7.2 CyberRealistic Negative Embeddingの効果測定
CivitaiやHuggingFaceの資料では、CyberRealistic専用のTextual Inversion(Embedding)である CyberRealistic Negative の使用が言及されている 28。
- 効果: このEmbeddingは、モデル開発者が「望ましくない出力(奇形、低画質、アニメ調)」のベクトルを集約して作成したものであり、プロンプトに一つ含めるだけで、数十単語分のネガティブプロンプトと同等以上の補正効果を発揮する。
- 使用法: ネガティブプロンプト欄に embedding:CyberRealistic_Negative-neg (ファイル名に応じる)と記述する。
- 注意点: SDXL版が存在するか確認が必要である。多くのEmbeddingはSD1.5用であり、SDXLでは動作しない。SDXL用が見つからない場合、一般的なSDXL用ネガティブEmbedding(例:UnrealisticDream, BadDream)で代用するか、前述のテキストプロンプトを充実させるアプローチが推奨される。
8. 結論と今後の展望
本調査の結果、CyberRealistic XL v8.0は、SDXLエコシステムにおいて「解剖学的安定性」と「テクスチャの物理的再現性」のバランスを極めて高いレベルで達成したモデルであることが確認された。
v8.0における「四肢の生成安定化」は、従来の生成AIが抱えていたガチャ(試行錯誤)の要素を減らし、実用的なワークフローへの導入を可能にしている。DPM++ 3M SDE KarrasサンプラーとNMKD-Siaxアップスケーラーを組み合わせ、ComfyUIによるDetail Daemonを用いた微細なノイズ制御を行うことで、もはや写真と区別のつかない「超現実」を作り出すことが可能である。
綾波レイの再現においては、アニメ的な記号を物理的なマテリアル(ラテックス、アルビノの特徴、フィルムの質感)へと翻訳するプロンプトエンジニアリングが成功の鍵となる。青い髪と赤い瞳という非現実的な要素を、フォトリアリズムの文脈で説得力を持って提示するためには、照明設計とカメラ設定(被写界深度、レンズミリ数)の指定が不可欠である。
今後の展望として、Pony系モデルのような高い制御性と、CyberRealisticのような圧倒的な質感が融合する方向性が予想されるが、現時点において「写真としての美学」を追求するクリエイターにとって、CyberRealistic XL v8.0は最適な選択肢の一つであると結論付けられる。
以上
引用文献
- Update README.md · cyberdelia/CyberRealistic at e7b456d - Hugging Face, 1月 6, 2026にアクセス、 https://huggingface.co/cyberdelia/CyberRealistic/commit/e7b456d46194c1a63f4fd7c5602c47e269f5c39d
- cyberdelia/CyberRealisticXL - Hugging Face, 1月 6, 2026にアクセス、 https://huggingface.co/cyberdelia/CyberRealisticXL
- cyberdelia/CyberRealistic - Hugging Face, 1月 6, 2026にアクセス、 https://huggingface.co/cyberdelia/CyberRealistic
- CyberRealistic - v8.0 - stable diffusion api, 1月 6, 2026にアクセス、 https://stablediffusionapi.com/models/cyberrealistic-v8-0
- Anyone knows how to achieve this realistic style using XL or maybe 1.5? : r/civitai - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/civitai/comments/1oivgw3/anyone_knows_how_to_achieve_this_realistic_style/
- Best SDXL/Illustrious model for photorealism : r/comfyui - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/comfyui/comments/1pitf5y/best_sdxlillustrious_model_for_photorealism/
- Cyber Realistic Realistic AI Model In 7 Minutes – Stable Diffusion (Automatic1111), 1月 6, 2026にアクセス、 https://www.youtube.com/watch?v=ha4fI_MoD6I
- ComfyUI Workflow/Tutorial - How I make my images look just a bit more realistic (Tutorial in comments) - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/comfyui/comments/1j0y2ox/comfyui_workflowtutorial_how_i_make_my_images/
- ComfyUI Node: Detail Daemon Sampler, 1月 6, 2026にアクセス、 https://www.runcomfy.com/comfyui-nodes/ComfyUI-Detail-Daemon/detail-daemon-sampler-node
- A port of muerrilla's sd-webui-Detail-Daemon as a node for ComfyUI, to adjust sigmas that control detail. - GitHub, 1月 6, 2026にアクセス、 https://github.com/Jonseed/ComfyUI-Detail-Daemon
- Detail Daemon node released for ComfyUI! - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/comfyui/comments/1gf66vh/detail_daemon_node_released_for_comfyui/
- Using Detail Daemon in ComfyUI for Extra Details! - YouTube, 1月 6, 2026にアクセス、 https://www.youtube.com/watch?v=dG9HfgngsqM
- FreeU setting for SDXL : r/comfyui - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/comfyui/comments/16s37w4/freeu_setting_for_sdxl/
- New ComfyUI Tutorial up for a pretty amazing new core node, FreeU! : r/StableDiffusion, 1月 6, 2026にアクセス、 https://www.reddit.com/r/StableDiffusion/comments/16qigny/new_comfyui_tutorial_up_for_a_pretty_amazing_new/
- roblaughter/comfyui-workflows - GitHub, 1月 6, 2026にアクセス、 https://github.com/roblaughter/comfyui-workflows
- Blazing Fast Face Detailer Workflow for ComfyUI - Next Diffusion, 1月 6, 2026にアクセス、 https://www.nextdiffusion.ai/tutorials/blazing-fast-face-detailer-workflow-for-comfyui
- ComfyUI: Face Detailer (Workflow Tutorial) - YouTube, 1月 6, 2026にアクセス、 https://www.youtube.com/watch?v=_uaO7VOv3FA
- What's your go-to model for realistic images? : r/StableDiffusion - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/StableDiffusion/comments/1cdagr9/whats_your_goto_model_for_realistic_images/
- Favorite Negative Prompts for Photo Realistic : r/StableDiffusion - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/StableDiffusion/comments/120sozo/favorite_negative_prompts_for_photo_realistic/
- Whats the difference between these 3 CyberRealistic checkpoints: XL, Pony and Pony Catalyst? : r/StableDiffusion - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/StableDiffusion/comments/1knu6bq/whats_the_difference_between_these_3/
- Why does Rei have light blue hair and red eyes? : r/evangelion - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/evangelion/comments/ugc9b5/why_does_rei_have_light_blue_hair_and_red_eyes/
- I just realized that Rei has blue hair and red eyes, while Asuka has red hair and blue eyes. So I edited their eyes to match their respective hair colors. : r/evangelion - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/evangelion/comments/sggmer/i_just_realized_that_rei_has_blue_hair_and_red/
- 1:6 Rei Ayanami in [fictional} plugsuit (created/photographed by Dizzyfugu) - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/evangelion/comments/1da5yyf/16_rei_ayanami_in_fictional_plugsuit/
- Rebuild of Evangelion 30 Minutes Preference Rei Ayanami (Plugsuit Ver.) Model Kit, 1月 6, 2026にアクセス、 https://gundamplacestore.com/products/30-minutes-preference-rai-ayanami-plug-suit-ver
- Ayanami Rei (Evangelion) AI Art - PixAI, 1月 6, 2026にアクセス、 https://pixai.art/artwork/1680764411412495079
- Best Negative Prompts for Stable Diffusion - Generative AI Blog by Segmind, 1月 6, 2026にアクセス、 https://blog.segmind.com/best-negative-prompts-in-stable-diffusion/
- List of Key Words-Negative Prompt - AI Visualizer - Vectorworks Forum, 1月 6, 2026にアクセス、 https://forum.vectorworks.net/index.php?/topic/116408-list-of-key-words-negative-prompt/
- CyberRealistic_Negative-neg.civitai.info · wsj1995/embeddings at main - Hugging Face, 1月 6, 2026にアクセス、 https://huggingface.co/wsj1995/embeddings/blob/main/CyberRealistic_Negative-neg.civitai.info
- What are some must have negative embeddings for SD 1.5? : r/StableDiffusion - Reddit, 1月 6, 2026にアクセス、 https://www.reddit.com/r/StableDiffusion/comments/17ii0f6/what_are_some_must_have_negative_embeddings_for/

