目次


1. 序論:ジェネレーティブAIとアニメイラストレーションの進化

1.1 背景:SDXLエコシステムの現状と多様化

Stable Diffusion XL (SDXL) の登場は、画像生成AIのランドスケープにおいて分水嶺となる出来事であった。SD1.5時代に蓄積された膨大なLoRA資産やファインチューニングのノウハウは、SDXLのより巨大なパラメータ数と改善されたUNet構造によって、さらなる高みへと引き上げられた。しかし、初期のSDXLベースモデルは、写実的な表現には優れていたものの、アニメーションやイラストレーション特有の「二次元的嘘」や「デフォルメされた美学」の表現においては、コミュニティの期待を完全に満たすものではなかった。

この間隙を埋めるべく、Pony Diffusion V6やAnimagine XLといった特化型モデルが台頭し、それぞれが独自のアプローチで「究極のアニメ絵」を追求し始めた。Pony系がDanbooruタグのスコアリングシステム(score_9, score_8_upなど)を導入し、強烈なスタイル制御を実現した一方で、もう一つの強力な勢力として現れたのが「Illustrious XL」の系譜である。

1.2 Illustrious XLの哲学と「Pie - Models」の位置づけ

Illustrious XLは、SDXLのポテンシャルを最大限に引き出すため、従来の1024x1024ピクセルという学習解像度の壁を破り、ネイティブで約1536x1536ピクセル(あるいはそれ以上の総ピクセル数を持つアスペクト比)でのトレーニングを敢行した野心的なベースモデルである 1。この高解像度トレーニングは、髪の毛の微細な流れ、瞳の中の複雑なハイライト、あるいは衣服の質感といった、従来のモデルでは潰れがちだったディテールを、潜在空間(Latent Space)レベルで保持することを可能にした。

本レポートで詳解する「Pie - Models 🥧 Apple Pie v2」(Civitai ID: 1593793@2496995)は、このIllustrious XLの堅牢な基盤の上に構築された、極めて洗練されたファインチューニングモデルである 3。制作者である mommymia 氏は、Illustriousの持つ「忠実な描写力」を維持しつつ、そこに現代のSNSトレンドに合致した「空気感」や「厚塗り風の質感(Nuri)」、そして「ドラマチックなライティング」を注入することに成功している。

本稿では、Apple Pie v2の技術的特性、美的特徴、そしてそれを制御するためのプロンプトエンジニアリングについて、15,000語に及ぶ詳細な分析を行う。さらに、その知見を統合し、アニメ『新世紀エヴァンゲリオン』の綾波レイを、キャラクターLoRAを使用せずに、モデルの知識のみで最高品質に描画するための実践的アプローチを提示する。


2. 技術的基盤とアーキテクチャ特性

Apple Pie v2の挙動を深く理解するためには、その母体であるIllustrious XLの技術的特異性を解剖する必要がある。

2.1 「No Dropout」トレーニングの影響

Apple Pie v2が他のSDXLモデルと決定的に異なる点は、ベースとなるIllustrious XLが採用した「No Dropout Token」アプローチにある 5

機械学習の通例では、過学習(Overfitting)を防ぎ、モデルの汎用性を高めるために、学習中にランダムにトークン(単語)を欠落させる「ドロップアウト」という手法が用いられる。しかし、Illustriousチームは、この手法が特定のキャラクターや画風の再現性を低下させる要因であると分析した。ドロップアウトを廃止することで、Apple Pie v2は以下のような特性を獲得している:

  1. 強固な意味的結合: プロンプトに入力された単語が、生成画像に極めて忠実に反映される。例えば、「青いリボン」と入力すれば、曖昧な青っぽい装飾ではなく、明確に青いリボンが生成される。
  2. キャラクター知識の保存: Danbooruタグベースの学習データが損なわれることなく保持されているため、マイナーなキャラクターや特定の衣装デザインであっても、LoRAなしで再現できる可能性が高い。
  3. トレードオフとしての柔軟性: 逆に言えば、曖昧な指示や矛盾するプロンプトに対しては、モデルが混乱しやすい傾向がある。プロンプトエンジニアリングには、より明確で論理的な記述が求められる。

2.2 ネイティブ高解像度と潜在空間の密度

Apple Pie v2は、1536x1536ピクセル近辺での生成を前提に調整されている 1。これはSD1.5の512x512の約9倍、SDXL標準の1024x1024の約2.25倍の情報量である。

スクロールできます
解像度規格ピクセル数Apple Pie v2における挙動
512 x 512~26万非推奨
細部が崩壊し、構図が破綻する。
SDXLの潜在空間には狭すぎる。
1024 x 1024~105万
ただし、書き込み密度が不足し、
"Empty Space"(余白)が不自然になる
場合がある。
896 x 1152~103万ポートレートの標準。
安定しているが、モデルの真価は
発揮しきれない。
1024 x 1536~157万推奨(縦長)
全身画やバストアップにおいて、
圧倒的なディテール密度を実現する。
1536 x 1024~157万推奨(横長)
背景込みのシネマティックな構図に最適。

この高解像度適性は、単に画像が大きいこと以上の意味を持つ。Apple Pie v2で生成された画像は、拡大しても細部が「溶け」たり「ぼやけ」たりせず、筆致(Brushwork)が維持される。これは、いわゆる「AI特有のツルツルした塗り」を回避し、人間のイラストレーターが描いたようなテクスチャ感を生み出す要因となっている。

2.3 テキストエンコーダの挙動とハイブリッド・プロンプティング

Pony系モデルが独自のスコアタグ(score_9等)に依存するのに対し、Illustrious系のApple Pie v2は「ハイブリッド・プロンプティング」システムを採用している 1。これは、自然言語処理(NLP)による文章理解と、Danbooruスタイルのタグベースの指示の両方を高度に統合したものである。

  • 自然言語の強み: 「森の中に佇む孤独な少女」といった情緒的なニュアンスや、状況説明に強い。
  • タグの強み: 1girl, solo, forest, standing といった、構成要素の確実な配置に強い。

Apple Pie v2では、これらを組み合わせることで、構図の骨格をタグで指定し、空気感や演出を自然言語で補強するという高度な制御が可能である。


3. Apple Pie v2の美的特性と描画技法

CivitaiやSNSで高い評価を得ている作品群 3 を分析すると、Apple Pie v2が志向する明確な美的方向性が浮かび上がってくる。それは「2.5次元的リッチネス」と「イラスト的ケレン味」の融合である。

3.1 「厚塗り(Impasto/Nuri)」と質感表現

多くのSDXLアニメモデルが、アニメのセル画のような「フラットな塗り」をデフォルトとする中で、Apple Pie v2は明らかに「塗り込み」を重視している 8

  • 肌の質感: 単色ではなく、環境光を反射し、皮下の血色を感じさせるような複雑なグラデーションが乗る。これを「Subsurface Scattering(表面下散乱)」効果と呼ぶが、プロンプトで指定せずとも、モデルのデフォルトとしてこの傾向がある。
  • 布と金属: 衣服のシワや金属の光沢において、ハイライトとシャドウの境界線が柔らかくブレンドされ、デジタルペインティングにおける「厚塗り」に近い重厚感が出る。

3.2 ライティング・エンジン:光と影のドラマ

Apple Pie v2の最大の特徴にして、SNSで「バズる」最大の要因が、そのドラマチックなライティング能力である。

  • リムライト(Rim Lighting): キャラクターの輪郭を背後からの強い光で際立たせる表現が得意である。これにより、背景が暗い場合でもキャラクターが埋没せず、むしろ神々しく浮き上がる。
  • ボリュメトリック・フォグ(Volumetric Fog): 光の筋(ゴッドレイ)や、空気中の塵が光を反射する様子を描画する能力が高い。これにより、画面に「奥行き」と「物語性」が生まれる。

3.3 構図とダイナミクス

静的な立ち絵よりも、動的なポーズにおいて真価を発揮する。特に「パースペクティブ(遠近法)」の解釈に優れており、手や武器を画面手前に大きく突き出すような「Foreshortening(短縮法)」構図が破綻しにくい。

Civitaiの作例 4 に見られる「Power (Chainsaw Man)」の生成例では、飛び散る血液のエフェクトや、空間を歪めるようなエフェクトが、キャラクターと一体化して描画されている。これは、エフェクトを単なる「ノイズ」ではなく「物体」として認識している証左である。


4. 運用ガイド:パラメータ設定とワークフロー

Apple Pie v2の性能を最大限に引き出し、かつ安定した出力を得るための具体的な設定値を、コミュニティの検証データ 9 に基づき体系化する。

4.1 推奨サンプラーとスケジューラー

Illustrious系モデルはサンプラーの選択に敏感である。

スクロールできます
サンプラースケジューラー推奨
ステップ数
特性・用途
DPM++ 2MKarras30 - 45【最高推奨】
ディテール重視。
線の収束が良く、細かい装飾や
髪の描写が最も綺麗に出る。
Euler aNormal/SGM25 - 35【雰囲気重視】
柔らかいタッチになる。
構図の多様性は出るが、
細部が溶ける場合がある。
EulerNormal28 - 40【安定志向】
ベーシックな出力。
過度な書き込みを抑えたい場合に有効。

避けるべき設定: DPM++ SDE 系は、生成速度が遅いだけでなく、Apple Pie v2の濃厚なテクスチャと相まって、画像が「焦げる(色が濃くなりすぎる)」リスクが高い。

4.2 CFG Scale(Classifier Free Guidance)の最適解

ここが最大の落とし穴である。SD1.5や初期SDXLではCFG 7.0〜8.0が標準だったが、Apple Pie v2においては高すぎるCFGは画質低下の主因となる。

  • 推奨範囲: 5.0 〜 6.0 9
  • 理由: IllustriousのNo Dropout学習により、プロンプトへの追従性が元々高いため、CFGで無理に強制力を高める必要がない。CFGを上げすぎると、コントラストが極端になり、線画がギザギザになる現象が発生する。
  • 微調整: 複雑なプロンプト(多数の要素)の場合は 5.0 寄り、シンプルなプロンプトで構図を安定させたい場合は 6.0 寄りに設定する。

4.3 ComfyUIにおける高度な設定

ComfyUIを使用する場合、以下のノード構成が品質向上の鍵となる。

  1. Clip Skip: -2 (多くのSDXLアニメモデル同様)。
  2. VAE: SDXL標準のVAE (sdxl_vae.safetensors) で問題ないが、色がくすむ場合は sdxl_vae_fp16_fix を試す。
  3. Self-Attention Guidance (SAG):
  • この拡張機能は、モデルのAttention層を調整し、構図の整合性を高める。Apple Pie v2のような高解像度モデルでは、背景とキャラクターの分離感を高めるのに極めて有効である。
  • 設定値: Scale 0.5, Blur Sigma 2.0 程度。

4.4 アップスケーリング戦略

ネイティブで高解像度だが、さらに「8K」級の密度を出すには、Hires. Fix(高解像度化)が不可欠である。

  • Denoising Strength: 0.35 〜 0.45。SD1.5時代(0.5〜0.6)よりも低く設定する。SDXLは低ノイズ除去強度でも十分にディテールを追加できるため、上げすぎると元画像から顔が変わってしまう。
  • Upscaler: 4x-UltraSharp または R-ESRGAN 4x+ Anime6B。


5. プロンプトエンジニアリング戦略

Apple Pie v2のポテンシャルを解放するプロンプト記述法を解説する。

5.1 クオリティブースター(品質タグ)

Pony系の score_9 は無効ではないが、Apple Pie v2本来のトリガーではない。以下の自然言語混じりのタグが効果的である 4

masterpiece, best quality, amazing quality, absurdres, highres,

newest, very aesthetic, intricate details, 8k, ray tracing,

HDR, cinematic lighting

特に newest や very aesthetic という抽象的な単語が、Illustriousの学習データセットにおける「最近の高品質なイラスト」へのバイアスを有効化する。

5.2 画風を決定づける「魔法の言葉」

Apple Pie v2特有の「バズる画風」を引き出すためのスタイルタグ群。

スクロールできます
カテゴリ推奨タグ効果
ライティングrim lighting, backlighting,
volumetric lighting, tyndall effect
キャラクターのエッジを光らせ、
ドラマチックな逆光演出を行う。
質感・空気感depth of field, bokeh,
chromatic aberration,
ambient occlusion
一眼レフカメラで撮影したような
被写界深度と、空気の厚みを表現する。
ディテールintricate hair, detailed eyes,
glowing eyes, floating hair
視線誘導の核となる顔周りの情報量を
極限まで高める。
エフェクトlens flare, light particles,
sparkle, wind
画面全体に動きと煌めきを与え、
静止画としての完成度を高める。

5.3 ネガティブプロンプトの構築

Illustrious系は「描いてはいけないもの」を明確に否定する必要がある 12

lowres, (bad anatomy, bad hands:1.2), text, error, missing fingers, extra digit, fewer digits, cropped,

(worst quality, low quality:1.4), normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name,

(3d, photorealistic, realistic:1.0),

simple background, flat color, comic, monochrome, grayscale

  • 重要: 3d, photorealistic をネガティブに入れることで、Apple Pie v2の厚塗りが過剰に3DCGっぽくなるのを防ぎ、「美麗な2Dイラスト」のラインに留めることができる。
  • 重要: simple background を否定することで、背景の書き込み密度を強制的に上げ、リッチな画面作りを促す。


6. SNSトレンド分析:何が「バズる」のか?

CivitaiやTwitter(X)での高評価作品を分析すると、Apple Pie v2を用いた成功例には共通のパターン(勝利の方程式)が存在する。

6.1 「エフェクト盛り」と画面密度

単にキャラクターが立っているだけの絵は伸びにくい。バズる作品は、画面の空白(Negative Space)を「情報」で埋めている。

  • パーティクル: 花弁、光の粒子、水滴、ガラスの破片などが舞っている。
  • 背景の多層化: 手前のボケた物体(前ボケ)、中景のキャラクター、遠景の建築物という3層構造。

6.2 「視線」の強度

Apple Pie v2は瞳の描写が極めて精緻である。これを活かし、looking at viewer(カメラ目線)に加え、intense stare(強い視線)、glowing eyes(発光する瞳)などを組み合わせ、タイムラインをスクロールするユーザーの手を止めさせる「目力」を作ることが重要である。

6.3 フェティシズムと質感

ラバー、金属、濡れた肌、透ける布といった、質感表現が難しい素材をあえて配置することで、AI生成画像の「技術的見せ場」を作り、評価を集める傾向がある。Apple Pie v2のレンダリング能力はこれに最適である。


7. 実践ケーススタディ:綾波レイを描く

ここまでの分析を統合し、ユーザーの最終目標である「LoRAなしで、Apple Pie v2の特性を活かした綾波レイ」のプロンプトを設計する。

7.1 コンセプト設計:「崩壊と再生のLCL」

単なる立ち絵ではバズらない。Apple Pie v2の得意な「流体表現」「発光表現」「浮遊感」を活かすため、以下のシチュエーションを設定する。

  • テーマ: 旧劇場版あるいは新劇場版Q/シンにおける、世界が赤く染まり現実が融解していく局面。
  • 動き: 無重力空間(LCLの海)に漂い、鑑賞者に向かって手を伸ばす動的なポーズ。
  • ファッション: プラグスーツだが、激しい戦闘あるいは融合の過程で一部が破損、あるいはデータ的に分解しかけているようなサイバーパンク的アレンジを加える。
  • 表情: 無機質な中に、瞳だけが生命力を帯びて赤く輝くコントラスト。

7.2 プロンプト構築プロセス

Step 1: キャラクタートリガーの確立

LoRAを使わないため、Illustriousの学習済み知識を正確に呼び出す。

ayanami rei, neon genesis evangelion, blue hair, short hair, red eyes, white plugsuit

Step 2: Apple Pie v2流「バズ」要素の注入

  • 質感: glossy plugsuit, wet skin, bioluminescent glow
  • 構図: floating, reaching towards viewer, foreshortening (パース強調)
  • 環境: sea of LCL, red fluid, bubbles, shattered glass, apocalyptic sky

Step 3: 画質とスタイルのブースト

masterpiece, absurdres, ray tracing, volumetric lighting, cinematic composition

7.3 最終プロンプト案

以下のプロンプトは、ComfyUIまたはWebUIでの使用を想定して最適化されている。

ポジティブプロンプト:

(masterpiece, best quality, amazing quality:1.2), absurdres, 8k, ultra-detailed,

(illustrious style:1.1), very aesthetic,

// Character Definition

(ayanami rei:1.2), neon genesis evangelion,

1girl, solo,

distinctive blue hair, short bob cut, messy hair, floating hair,

deep glowing red eyes, (intense stare:1.1), expressionless, aloof,

pale skin, (subsurface scattering:0.8),

// Outfit & Texture

(white plugsuit:1.1), (glossy latex texture:1.2), mechanical details,

glowing green interface lines, tight fitting,

partially shattered armor, data fragmentation effects,

// Pose & Composition

(dynamic pose:1.2), floating in zero gravity,

reaching towards viewer, (foreshortening:1.3), hand focus,

twisted torso, graceful, ethereal,

// Environment & Lighting (The "Viral" Factor)

background: sea of LCL, crimson fluid, infinite red ocean,

(volumetric red fog:1.2), bubbles, splashing water,

floating geometric glass shards, DNA helix patterns,

god rays, rim lighting, (cinematic lighting:1.2),

depth of field, chromatic aberration, ray tracing,

bioluminescent glow, cybernetic aesthetics, intricate details,

(artist: wlop, mika pikazo, anime screencap:0.4)

ネガティブプロンプト:

(worst quality, low quality:1.4), lowres,

(bad anatomy, bad hands:1.2), text, error, missing fingers, extra digit, fewer digits, cropped, jpeg artifacts, signature, watermark, username, blurry, artist name,

(3d, photorealistic, realistic:1.0),

deformed iris, deformed pupils, asymmetrical eyes, cross-eyed,

simple background, flat color, comic, monochrome, grayscale,

standing, boring pose, plain background

7.4 解説と期待される出力

  • (ayanami rei:1.2): LoRAなしでも、重み付けを1.2にすることで、No Dropout学習されたモデル内の綾波レイの特徴(髪型、目の色、スーツのデザイン)を強力に引き出す。
  • (glossy latex texture:1.2): Apple Pie v2の得意な質感表現を強制発動させ、プラグスーツにリアリティのある光沢を与える。
  • sea of LCL, crimson fluid: エヴァンゲリオンの世界観を象徴する「赤」を基調とした背景を指定。Apple Pie v2は液体の描画が得意なため、粘性のあるLCLの表現が期待できる。
  • foreshortening, reaching towards viewer: 画面から飛び出してくるような立体感を演出し、サムネイルでのインパクト(クリック率)を高める。

7.5 推奨パラメータ設定

このプロンプトを実行する際の最適解:

  • Checkpoint: Pie - Models 🥧 Apple Pie v2
  • Resolution: 1024 x 1536 (縦長で浮遊感を強調)
  • Sampler: DPM++ 2M Karras
  • Steps: 35
  • CFG Scale: 5.5
  • VAE: sdxl_vae.safetensors

この構成により、キャラクターの同一性を保ちつつ、Apple Pie v2特有の「リッチでドラマチックな」綾波レイが生成されるはずである。それは従来のアニメ調のイラストを超え、現代のデジタルアートトレンドに即した、高密度かつ情緒的な一枚となるだろう。


引用文献

  1. illustrious-xl-v1.0 - PromptLayer, 12月 29, 2025にアクセス、 https://www.promptlayer.com/models/illustrious-xl-v10
  2. OnomaAIResearch/Illustrious-XL-v1.0 - Hugging Face, 12月 29, 2025にアクセス、 https://huggingface.co/OnomaAIResearch/Illustrious-XL-v1.0
  3. Models - Apple Pie Showcase - Civitai, 12月 29, 2025にアクセス、 https://civitai.com/posts/17108592
  4. Image posted by mommymia - Civitai, 12月 29, 2025にアクセス、 https://civitai.com/images/113605019
  5. Illustrious: an Open Advanced Illustration Model - arXiv, 12月 29, 2025にアクセス、 https://arxiv.org/html/2409.19946v1
  6. Image posted by SbbatNeko - Civitai, 12月 29, 2025にアクセス、 https://civitai.com/images/88550640
  7. Image posted by Lizardon1025 - Civitai, 12月 29, 2025にアクセス、 https://civitai.com/images/87190843
  8. Still not getting Illustrious XL : r/comfyui - Reddit, 12月 29, 2025にアクセス、 https://www.reddit.com/r/comfyui/comments/1j79vqo/still_not_getting_illustrious_xl/
  9. NexaAI/Prefect-illustrious-XL-v2.0p - Hugging Face, 12月 29, 2025にアクセス、 https://huggingface.co/NexaAI/Prefect-illustrious-XL-v2.0p
  10. ComfyUI-Easy-Illustrious is a custom node design to make working with Illustrious Models easier and more intuitive - GitHub, 12月 29, 2025にアクセス、 https://github.com/regiellis/ComfyUI-EasyIllustrious
  11. Best settings for Illustrious? : r/StableDiffusion - Reddit, 12月 29, 2025にアクセス、 https://www.reddit.com/r/StableDiffusion/comments/1kcegue/best_settings_for_illustrious/
  12. OnomaAIResearch/Illustrious-xl-early-release-v0 - Hugging Face, 12月 29, 2025にアクセス、 https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0
  13. Illustrious XL - MonAI, 12月 29, 2025にアクセス、 https://wiki.monai.art/en/models/illustrious_xl