主宰から

セミリアルとリアル、目を見張る進化

とにかくAIの進歩が凄まじく、全然ついていけていません。次から次へと新しい技術スタイルが出てきてトレンドが移り変わっています。が、Illustrious系のチェックポイントは、まだまだ新しく進化しています。セミリアル/リアル調のものが顕著で、このMM v2.0も、まだまだ驚く進化をしているもののひとつ。特に最近は”〇〇限定”といったものが多い中、ダウンロードして使える高機能なものとして重宝しそうです。


目次


1. 序論

1.1 背景と目的

生成AI技術の急速な進展に伴い、画像生成モデル、特にStable Diffusion XL (SDXL) エコシステムは多様化の一途をたどっている。その中でも、アニメーションスタイルと写実的(フォトリアル)な質感を融合させた「2.5次元」または「セミリアル(Semi-Real)」と呼ばれる領域は、クリエイターや愛好家の間で極めて高い需要を維持している。本報告書は、この特定の美的領域においてCivitai等のプラットフォームで注目を集めるチェックポイントモデル「Semi-Real (Illustrious) | MM v2.0」(以下、MM v2.0)を対象とした詳細な技術調査報告である。

本調査の目的は、MM v2.0の基本特性、技術的仕様、およびプロンプトエンジニアリングの最適解を体系化することにある。特に、ユーザーが求める「SNSで評価される(バズる)」視覚表現を達成するために必要な具体的な技法、パラメータ設定、および応用例を提示する。さらに、アニメ作品『ヱヴァンゲリヲン新劇場版』のキャラクター「真希波・マリ・イラストリアス」をケーススタディとして採用し、キャラクターLoRA(Low-Rank Adaptation)に依存せずに、モデルの基礎能力のみで高度なキャラクター再現と魅力的な作風を実現するためのプロンプト設計を実証する。

1.2 対象モデルの特定

  • モデル名: Semi-Real (Illustrious) | MM v2.0
  • Civitai ID: 1945811 (Version ID: 2310568)
  • ベースモデル: Illustrious XL
  • 作成者: mommymia
  • カテゴリ: Checkpoint Merge (SDXL 1.0)

MM v2.0は、OnomaAIが開発した「Illustrious XL」をベースとしており、Danbooruタグシステムへの高い親和性と、イラストレーション特有の鮮やかな色彩設計を継承しつつ、マージ技術によって写実的なテクスチャ深度を付加したモデルである1


2. モデル概要とアーキテクチャ特性分析

2.1 Illustrious XL エコシステムにおける位置づけ

MM v2.0を深く理解するためには、その母体であるIllustrious XLの特性を把握することが不可欠である。Illustrious XLは、Pony Diffusion XLやAnimagine XLといった他の主要なアニメ系SDXLモデルとは異なる系譜に属する。最大の特徴は、Danbooru2023データセットを用いた大規模なファインチューニングにあり、これにより「タグベースのプロンプティング」に対して極めて敏感な反応を示すアーキテクチャとなっている3

Pony系モデルが自然言語とスコアタグ(score_9, score_8_up等)による制御を好むのに対し、Illustrious系は従来のBooruタグ(1girl, solo, blue_eyes 等のカンマ区切り)を好む傾向がある。MM v2.0はこの特性を受け継ぎつつ、作成者mommymia氏による独自のマージ調整を経て、Illustrious特有の「平坦になりがちなアニメ塗り」を克服し、物理ベースレンダリング(PBR)に近い光学的リアリズムを獲得している点が革新的である。

2.2 「Semi-Real」の定義と技術的達成

本モデルが冠する「Semi-Real」とは、単なる「アニメと実写の中間」という曖昧な定義を超えた、特定の美的均衡を指す。技術的な観点から分析すると、以下の要素の結合によって成立している。

  1. 表面下散乱(Subsurface Scattering, SSS)の模倣:
    純粋なアニメモデルでは肌は単色または単純なグラデーションで表現されるが、MM v2.0では肌の内部で光が散乱する現象を模倣したような、透明感と柔らかさを持つテクスチャが出力される。これにより、フィギュアや3DCGキャラクターのような「物質感」が生まれる。
  2. 環境遮蔽(Ambient Occlusion, AO)の強化:
    物体同士が接する部分や光が届きにくい部分に落ちる影(オクルージョン)が、従来のアニメモデルよりも深く、リアルに描画される。これが画面全体に重厚感と立体感を与える要因となっている。
  3. マテリアル(素材)の識別能力:
    ラテックス、金属、シルク、デニムといった異なる素材の質感(粗さ、反射率、光沢)を、プロンプトの指示に従って正確に描き分ける能力が強化されている。これはマージ元のモデルに含まれるフォトリアル系データの重みが影響していると推測される5。

2.3 プロンプト応答性と推奨設定

調査の結果、MM v2.0はプロンプトに対し高い忠実度(Adherence)を持つ一方で、過剰なトークン数や矛盾する指示に対しては敏感に反応し、画質低下を招く可能性があることが判明した。

  • 推奨解像度: 1024x1024, 832x1216, 1216x832(SDXLネイティブ解像度)
  • Clip Skip: 1 または 2(Illustriousベースは通常1だが、マージモデルの特性により2が好まれる場合もある。本モデルでは1が推奨される傾向にある)
  • VAE: モデルに焼き込まれている(Baked)場合が多いが、色がくすむ場合は sdxl_vae.safetensors の明示的な指定が有効である。

3. 表現ジャンル別・高評価作品の傾向調査

SNS(X, Reddit)や画像共有サイト(Civitai, SeaArt等)におけるトレンド調査に基づき、MM v2.0を用いて生成され、高い評価(Likes, Re-posts)を獲得している作品群を分析した。その結果、以下の5つの主要ジャンルに加え、特筆すべきサブジャンルが確認された。

3.1 アニメ (Premium Anime Style)

  • 画風特性:
    テレビアニメのキャプチャというよりは、劇場版アニメのキービジュアルや、高予算ソーシャルゲームのSSRカードイラストに近い「リッチな」アニメスタイル。線画は明確だが、塗りには厚みがあり、光のエフェクト(ブルーム、レンズフレア)が多用される。
  • バズる要素:
    「情報量の密度(Density)」が鍵となる。背景まで緻密に描き込まれた図書館や魔法研究所、あるいはキャラクターの衣装の装飾(フリル、レース、鎧の彫金)が細部まで破綻なく描かれている作品が好まれる。
  • 代表的なタグ:
    anime coloring, official art, highres, intricate details, dynamic angle.

3.2 フォトリアル (Cosplay / Gravure Realism)

  • 画風特性:
    アニメキャラクターの骨格(大きな目、理想的なプロポーション)を維持したまま、皮膚の質感や髪の毛の描写を極限まで写実的にしたスタイル。いわゆる「2.5次元コスプレイヤー」の実写写真のような趣がある。
  • バズる要素:
    「実在感」と「非実在性」のギャップ。現実にはあり得ない髪色や瞳の色を持つキャラクターが、現実の渋谷の交差点や自然光の中に違和感なく溶け込んでいる構図が高いエンゲージメントを生む。特に、肌のキメ(Skin pores)や産毛の表現が評価基準となる。
  • 代表的なタグ:
    photorealistic, realistic, raw photo, 8k, detailed skin, shot on 50mm, depth of field.

3.3 2.5次元的セミリアル (Figurine / 3D Render Style)

  • 画風特性:
    本モデルの最も得意とする領域。BlenderのCyclesやUnreal Engine 5でレンダリングされたような、極めて高品質な3DCGアートスタイル。フィギュアのボックスアートのような、完璧にコントロールされたライティングと質感が特徴。
  • バズる要素:
    「フェティシズムの具現化」。ラテックススーツの光沢、黒タイツの透け感、金属鎧の映り込みなど、素材の質感に対する執着的な描写が評価される。視聴者が触覚的に想像できるほどの質感が求められる。
  • 代表的なタグ:
    3d, render, octane render, unreal engine 5, blender, c4d, volumetric lighting, subsurface scattering.

3.4 ファンタジーアート風 (Dark Fantasy / Thick Paint)

  • 画風特性:
    油彩や厚塗り(Impasto)の技法を取り入れた、重厚で絵画的なスタイル。MM v2.0は色の階調が豊かであるため、暗部が潰れずに深い色彩を表現できる。
  • バズる要素:
    「エピックな世界観」。巨大なドラゴンと対峙する戦士、荒廃した古城、魔法の光が満ちる森林など、物語性を感じさせる一枚絵が人気である。
  • 代表的なタグ:
    oil painting, thick paint, fantasy, dark fantasy, concept art, greg rutkowski, artstation.

3.5 芸術的・アーティスティックな作風 (Abstract / Stylized)

  • 画風特性:
    水彩画、インク画(Sumi-e)、あるいはアール・ヌーヴォー(Alphonse Mucha風)など、特定の芸術様式を模倣・融合させたスタイル。AI特有の「ハルシネーション(幻覚)」を創造的に利用し、髪の毛が花や炎に変化するような抽象表現も含まれる。
  • バズる要素:
    「視覚的インパクトと新規性」。既存のアニメ絵の枠に収まらない、色使いや構図の大胆さが評価される。ネガティブプロンプトをあえて弱め、モデルの創造性を解放する手法が取られることもある。
  • 代表的なタグ:
    abstract, surreal, watercolor, ink wash painting, colorful, vibrant colors, flowery.

3.6 追記:サイバーパンク・ネオン (Cyberpunk Neon / Night Photography)

  • 特筆すべきジャンル:
    調査の結果、MM v2.0は**「夜景とネオンの反射」**において卓越した性能を示すことが確認された。Illustriousベースのモデルはコントラストが高く、黒の締まりが良いため、サイバーパンク的な夜景ポートレートにおいて、濡れた路面への反射やネオンサインの逆光表現(Rim Lighting)が極めて美しく出力される6。これは上記5ジャンルとは別に、独立して評価されるべき強力な特性である。

4. 特性別・最適化プロンプトおよびパラメータ設定

MM v2.0のポテンシャルを最大限に引き出すため、特に優位性の高い3つのジャンル(2.5次元的セミリアルフォトリアルサイバーパンク・ネオン)を選定し、具体的な運用技術を解説する。

4.1 ジャンルA: 2.5次元的セミリアル (The 2.5D Aesthetics)

このジャンルはMM v2.0の「ホームグラウンド」であり、ユーザーが最も期待する出力である。

推奨パラメータ (ComfyUI / WebUI)

  • Sampler: DPM++ 2M SDE Karras または DPM++ 3M SDE Karras
  • 理由: SDE(Stochastic Differential Equations)系のサンプラーは、生成プロセス中に適度なノイズ変動を持たせるため、肌や布の微細なテクスチャを潰さずに定着させるのに適している。Karras スケジューリングは、ステップごとのノイズ除去効率を最適化し、より少ないステップで高品質なディテールを生成する。
  • Steps: 30 - 45
  • 2.5Dの質感を高めるには、通常よりもやや多めのステップ数が必要となる。
  • CFG Scale: 5.0 - 7.0
  • 高すぎるとコントラストがきつくなりすぎ、プラスチック感が強まる。6.0付近がスイートスポットである。

プロンプト戦略

  • Positive:
    masterpiece, best quality, absurdres, 3d, cgi, render, unreal engine 5, octane render, subsurface scattering, volumetric lighting, depth of field, ray tracing, 8k, (finely detailed:1.2)
  • Negative:
    lowres, worst quality, bad quality, flat color, 2d, sketch, cartoon, anime, simple background, (jagged lines:1.2), cel shading, outline
  • 推奨LoRA / Embeddings:
  • Texture/Skin LoRA: Detailed Skin や Pore Detailer 系のLoRAを強度0.3程度で併用すると、人形っぽさを回避しつつ2.5D感を維持できる。
  • Clothing Material LoRA: Latex, Satin, Denim などの素材特化LoRAは、MM v2.0のマテリアル表現力をさらにブーストする。

4.2 ジャンルB: フォトリアル (Hyper-Realistic Portrait)

アニメキャラクターの実在感を追求するスタイル。

推奨パラメータ

  • Sampler: Restart または Euler a
  • 理由: Restart サンプラーは、生成の途中でリスタートを繰り返すことで、細部の整合性を高める効果がある。Euler a は柔らかい表現になりやすく、ポートレートの肌表現に適している場合があるが、ディテールが甘くなるリスクもあるため、高解像度化(Hires. Fix)が必須となる。
  • Steps: 40 - 60
  • CFG Scale: 4.5 - 6.0
  • プロンプトへの厳格さを少し緩めることで、写真特有の「偶然性」や「自然な乱れ」を許容させる。

プロンプト戦略

  • Positive:
    photorealistic, realistic, raw photo, photograph, dslr, 50mm, f/1.8, bokeh, film grain, texture, detailed skin, skin pores, hyperrealism, soft lighting, natural lighting, (complex lighting:1.1)
  • Negative:
    painting, drawing, illustration, anime, sketch, 3d render, plastic skin, smooth skin, oversaturated, cartoon, (airbrushed:1.2), makeup
  • 推奨技術:
  • Adetailer (Face Detailer): フォトリアルにおいては、顔の崩れが致命的となるため、face_yolov8n_v2 等を用いたAdetailerの適用が推奨される1。ただし、Denoising strengthを高くしすぎると(0.4以上)、顔だけが画風から浮いてしまうため、0.25-0.35程度に抑えるのがコツである。

4.3 ジャンルC: サイバーパンク・ネオン (Cinematic Lighting)

光と影のコントラストを極限まで高めた、ドラマチックなスタイル。

推奨パラメータ

  • Sampler: DPM++ 2M Karras
  • 理由: 光のグラデーション(階調)を滑らかに表現し、暗部のノイズやバンディング(色の縞模様)を防ぐために、最も安定したサンプラーが推奨される。
  • CFG Scale: 6.5 - 8.0
  • コントラストと彩度を強調するため、やや高めに設定する。

プロンプト戦略

  • Positive:
    masterpiece, best quality, cyberpunk, neon lights, city lights, night, rain, wet street, reflection, chromatic aberration, lens flare, cinematic lighting, rim lighting, atmospheric, moody, backlighting, glow
  • Negative:
    daylight, bright, sunny, flat lighting, low contrast, washed out, simple background, white background
  • 推奨技術:
  • ComfyUI Node: ColorMatch や ImageToneMapping ノードを使用して、生成後の画像のダイナミックレンジを調整すると、さらに「映える」画像となる。

5. ケーススタディ:真希波・マリ・イラストリアスの描画

本セクションでは、アニメ『ヱヴァンゲリヲン新劇場版』のキャラクター「真希波・マリ・イラストリアス」を題材に、キャラクターLoRAを使用せず、プロンプトのみで彼女を再現し、かつMM v2.0の特性を活かした3つの異なる作風で描画するための具体的なプロンプト構成を考察する。

5.1 キャラクター解析とタグ構築

IllustriousベースのモデルはDanbooruタグの知識が豊富であるため、マリの外見的特徴を正確なタグに分解し、再構築することでLoRAなしでも高い再現性が可能である。

  • 基本タグ: makinami mari illustrious, 1girl, solo.
  • 外見特徴: brown hair (または dark brown hair), twin tails (または long hair + two side up), glasses, red-framed eyewear (Q以降は black-framed eyewear も可だが、赤フレームが象徴的), green eyes (または teal eyes).
  • 性格・表情: smirk (不敵な笑み), smile, mischievous (悪戯っぽい), confident.
  • 衣装バリエーション: plugsuit, pink plugsuit (旧型/8号機), white plugsuit (新型/深々度ダイブ用), school uniform (制服).

5.2 作風A: 2.5次元的セミリアル「深々度ダイブ・プラグスーツ」

コンセプト:

『シン・エヴァンゲリオン劇場版』で登場した白い「深々度ダイブ用プラグスーツ」の質感と、出撃直前の緊張感を表現する。ラテックスの光沢と機械的なディテールの対比で魅せる、フィギュアのパッケージアート風を目指す。

  • Buzz Factor:
    身体のラインを強調する「煽り構図 (from below)」と、メカニカルな背景の密度。SNSでは「質感のリアルさ」がサムネイルでのクリック率を高める。

Prompt:

(masterpiece, best quality:1.2), absurdres, newest, very aesthetic,

1girl, solo, makinami mari illustrious,

(white plugsuit:1.3), (pink accents:1.1), (glossy latex:1.2), mechanical parts, glowing interface,

brown hair, twin tails, red-framed glasses, green eyes,

smirk, looking at viewer, hand on hip, confident pose,

(scifi interior:1.2), evangelion entry plug, cockpit, intricate details,

(ray tracing:1.2), reflection, volumetric lighting, bloom, chromatic aberration,

2.5d, unreal engine 5 render, cgi, semi-realistic,

depth of field, dutch angle, dynamic composition, low angle

Negative Prompt:

lowres, worst quality, bad quality, (bad anatomy:1.2), bad hands, missing fingers,

flat color, 2d, sketch, cartoon, simple background, helmet, mask,

(distorted glasses:1.3), opaque glasses, cel shading

5.3 作風B: フォトリアル「第3新東京市の放課後」

コンセプト:

「もしマリが現実にいたら」という仮定に基づくポートレート。制服姿で第3新東京市(あるいは現代の東京)の屋上に佇む、プライベートな瞬間を切り取る。

  • Buzz Factor:
    「エモい(Emotional)」逆光表現と、風になびく髪。背景に夕日を配置し、レンズフレアを入れることで、物語性とノスタルジーを喚起させる。

Prompt:

(photorealistic:1.3), raw photo, (masterpiece, best quality:1.2),

1girl, solo, makinami mari illustrious,

school uniform, white shirt, green plaid skirt, necktie,

brown hair, twin tails, red-framed glasses, green eyes, mole under right eye,

gentle smile, blushing, looking back,

(rooftop:1.2), fence, sunset, golden hour, lens flare,

wind, floating hair, messy hair,

depth of field, bokeh, (detailed skin texture:1.2), soft lighting,

fujifilm xt4, 85mm lens, cinematic shot, emotional, candid

Negative Prompt:

painting, illustration, anime, 3d render, plastic skin, cartoon,

(unnatural lighting), flash photography, stiff pose,

bad anatomy, bad hands, extra digits, monochrome, grayscale

5.4 作風C: サイバーパンク・ネオン「ザ・ビースト・モード」

コンセプト:

エヴァ2号機の「ザ・ビースト(獣化第2形態)」発動時のような、野性的かつ混沌としたエネルギーを、ネオンとインク飛沫(Splatter)で表現するアート作品。

  • Buzz Factor:
    圧倒的な色彩の暴力と、視線誘導の巧みさ。サムネイルで目立つ「高彩度」と、通常のマリとは異なる「狂気」の表情(舌出し、見開き目)がインパクトを与える。

Prompt:

(masterpiece, best quality:1.4), absurdres, artistic,

1girl, solo, makinami mari illustrious,

pink plugsuit, pilot suit, torn clothes, battle damage,

brown hair, messy hair, twin tails, red-framed glasses, glowing green eyes,

crazy smile, open mouth, shouting, tongue,

(abstract background:1.3), neon lights, cybernetics, data streams,

(splatter art:1.2), ink splash, vibrant colors, high contrast,

dynamic pose, reaching towards viewer, foreshortening,

cinematic lighting, rim lighting, intense atmosphere, cyberpunk

Negative Prompt:

lowres, worst quality, calm, static pose, boring,

monochrome, muted colors, simple background,

bad anatomy, deformed limbs, blurry, pixelated


6. 技術的考察と高度なワークフロー

6.1 アップスケーリングと高解像度化戦略

MM v2.0はネイティブで高解像度(1024px前後)をサポートしているが、書き込み量をさらに増やすためには、生成後のアップスケール処理が不可欠である。ComfyUIにおいては、「Latent Upscale」よりも「Model-based Upscale (e.g., 4x-UltraSharp)」を行い、その後に低いDenoise値(0.3-0.4)で再度サンプリングを行う「Hires. Fix」ワークフローが、2.5Dの質感を維持する上で最も効果的である。

6.2 LoRA不要論の検証と限界

今回のマリの生成考察において、Illustriousベースのモデルは、主要なアニメキャラクターであればLoRAなしでも高い再現性を持つことが示唆された。これは、学習データセット(Danbooru)のタグ付けが正確であることに起因する。特にMM v2.0のようなマージモデルは、キャラクターの特徴を保持しつつ、画風だけをリッチにするため、キャラクターLoRA特有の「画風の固定化(LoRAの画風に引っ張られる現象)」を回避できる利点がある。

ただし、マイナーなキャラクターや、複雑な衣装の正確な再現(例:特定のプラグスーツの背面のデザインなど)には、依然として専用LoRAの補助が必要となる場合がある。その際も、重みを0.6-0.8程度に抑え、MM v2.0の質感を優先させる運用が望ましい。


7. 結論

「Semi-Real (Illustrious) | MM v2.0」は、従来の「Pony」系モデルが独占していたSDXLのニッチ市場に対し、「Illustrious」系モデルが持つ**「構成力の高さ」と「色彩の美しさ」**を武器に参入した強力なモデルである。

  • 強み: 2.5Dおよびセミリアル領域において、追加のLoRAなしでも極めて高い質感表現が可能である。特に「光」の扱いが巧みであり、単純なプロンプトでもドラマチックな絵作りができる。
  • 注意点: プロンプトへの忠実度が高い反面、Semi-Real の特性上、完全に平坦な2Dアニメ絵を出そうとすると、意図しない陰影が乗ることがある。その場合は、flat color や anime style を強調し、3d や realistic をネガティブに入れる調整が必要となる。

MM v2.0は、アニメとリアルの境界線を探索するクリエイターにとって、現時点で最もバランスの取れた選択肢の一つである。特に「質感」と「光」にこだわり、SNSでの視認性(サムネイル映え)を意識した作品作りにおいて、本報告書で提示したプロンプトエンジニアリングと設定は、強力な武器となるだろう。


引用文献

  1. Semi-Real (Illustrious) | MM - v2.0 - Civitai, 12月 5, 2025にアクセス、 https://civitai.com/models/1945811/semi-real-illustrious-or-mm
  2. Dessert - Models - Flan | Illustrious Checkpoint - Civitai, 12月 5, 2025にアクセス、 https://civitai.com/models/1884582/dessert-models
  3. Illustrious XL - MonAI, 12月 5, 2025にアクセス、 https://wiki.monai.art/en/models/illustrious_xl
  4. OnomaAIResearch/Illustrious-xl-early-release-v0 - Hugging Face, 12月 5, 2025にアクセス、 https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0
  5. Erotophilia - Real Anime Hybrid Semi-Real Illus... AI - PromptHero, 12月 5, 2025にアクセス、 https://prompthero.com/ai-models/erotophilia-real-anime-hybrid-semi-real-illustrious-checkpoint-download
  6. Tips for illustrious XL Prompting created with SeaArt AI, 12月 5, 2025にアクセス、 https://www.seaart.ai/articleDetail/csmspt99c71s73dqk2mg