- 1. 第1部:v11.0からv13.0への技術的アーキテクチャの進化
- 1.1. 1.1. 継承される「Illustrious」の系譜と基本特性
- 1.2. 1.2. v13.0における核心的変更点:マージ構成の高度化
- 1.3. 1.3. 【技術的深掘り】「DARE」技術の解明とそのインパクト
- 1.4. 1.4. v13.0の進化学的意義:「キャラクター知識の調整」の検証
- 1.4.1. 表1:Nova Anime XL IL v11.0 vs v13.0 主要諸元比較
- 2. 第2部:v13.0におけるプロンプト・フレームワークの最適化
- 2.1. 2.1. BREAKコマンドの有効性の再検証
- 2.2. 2.2. v13.0 推奨パラメータの分析
- 3. 第3部:v13.0 スタイル別マスターガイド(v11.0 PDFとの比較分析)
- 3.1. 3.1. 2.5D「セミリアル」:得意領域のさらなる洗練
- 3.2. 3.2. アニメ&セル画:公称される「知識調整」の真価
- 3.3. 3.3. フォトリアリズムへの挑戦:「弱点」は克服されたか
- 3.4. 3.4. 壮大なファンタジーおよびSFアート:複雑な構図の安定性
- 3.5. 3.5. 3DCG(様式化レンダリング)
- 3.5.1. 表2:v13.0 スタイル別推奨パラメータ(v11.0 PDFからの更新)
- 4. 第4部:【ケーススタディ】キャラクター生成能力の比較:アスカ・ラングレーの再描画(理論的検証)
- 4.1. 4.1. v11.0の課題(推測)
- 4.2. 4.2. v13.0の「キャラクター知識の調整」による改善予測
- 4.2.1. 予測1:詳細な属性の忠実度向上
- 4.2.2. 予測2:スタイルの安定性向上
- 4.3. 4.3. ケーススタディの結論
- 4.3.1. 比較1:ハイパーリアルなポートレート(「生存者の眼差し」)
- 4.3.2. 比較2:2.5Dシネマティック・スチル(「第3新東京市、屋上にて」
- 4.3.3. 比較3:失われたエヴァンゲリオンのフィルム(「90年代レトロスタイル」)
- 4.3.4. 比較4:宇宙戦争のワルキューレ(「ファンタジーアートへの再構築」)
- 4.3.5. 比較5:赤とオレンジによる抽象的研究(「心理的断片化」)
- 5. 第5部:結論と戦略的推奨事項
- 5.1. 5.1. v13.0へのアップグレード評価
- 6. 引用文献
第1部:v11.0からv13.0への技術的アーキテクチャの進化
本分析は、提供された「Nova Anime XL IL v11.0」(以下、v11.0 PDF)の詳細な技術的・芸術的分析をベンチマーク(基準)として設定し、最新版である「Nova Anime XL IL v13.0」の技術的構成と、それに伴う芸術的出力の「進化」を解明することを目的とします。
1.1. 継承される「Illustrious」の系譜と基本特性
分析の前提として、v11.0とv13.0は共に「IL」、すなわち「Illustrious」ベースの系譜に属します 。v11.0 PDFの分析によれば、Illustriousベースのモデルは以下の核となる特性を共有しています 。
- 美的バイアス: masterpiece, best quality, very aesthetic といった品質タグに強く反応し、高品質で審美的に優れた「イラスト風」の出力を生成することに強いバイアスを持っています 。
- プロンプト追従性: 他のモデルファミリーと比較して、優れたプロンプト追従性を持つとコミュニティで認識されています 。
- 知識構造: Danbooruタグに基づいた「概念的語彙」で構成されており、詩的な文章よりも正確な「タグエンジニアリング」を必要とします 。
- 本質的な制約: 「美しく洗練された画像」へのバイアスの裏返しとして、ざらついた質感や真のフォトリアリズムの生成には「積極的に抵抗する」とv11.0 PDFは結論付けています 。
v13.0もまた、このIllustriousの系譜を継承している ことから、本レポートの分析は「v13.0がこれらの基本特性を 変更 したか」ではなく、「v13.0がこれらの基本特性をどのように 洗練 させたか」という観点で行われます。
1.2. v13.0における核心的変更点:マージ構成の高度化
v11.0とv13.0の決定的な差異は、モデルを構成する「素材」ではなく、その「調理法」(マージ技術)にあります。
- v11.0の構成: NoobAI EPS v1.1 + Illustrious v2.0 stable hybrid core system 。
- v13.0の構成: NoobAI EPS v1.1 + Illustrious v2.0-stable DARE applied 。
両バージョンとも、基幹となる構成要素は「NoobAI EPS v1.1」と「Illustrious v2.0」で同一です。v11.0の「hybrid core system」 という表現は、加重平均(Weighted Sum)やブロックマージなど、パラメータを「足し合わせる」従来的なマージ手法を示唆します。
対照的に、v13.0では「DARE applied」 という明確な技術的変更が加えられています。構成要素が同一である以上、v11.0からv13.0へのいかなる「進化」も、このDARE技術の適用という唯一の変数によって引き起こされたものと断定できます。
1.3. 【技術的深掘り】「DARE」技術の解明とそのインパクト
DARE(Drop And REscale)は、近年のモデルマージ技術において注目される手法であり、特にパラメータの競合を解決するために設計されています 。
DAREは、ファインチューニングされたモデル(例:Illustrious v2.0)とベースモデル間の差分(デルタパラメータ)を分析します 。そのプロセスは以下の通りです。
- Drop(ドロップ): 差分パラメータのうち、値が小さい、あるいは冗長と見なされる大部分(最大90%とも言われる)を「ドロップ」、すなわちゼロ化(プルーニング、剪定)します 。
- REscale(リスケール): ゼロ化されずに残った、モデルの個性を決定づける重要な差分パラメータを「リスケール」、すなわち増幅させます 。
v11.0の「hybrid」マージ では、Illustrious v2.0の「美的感覚」とNoobAI EPS v1.1の「キャラクター知識」 が単純に加算され、両者のパラメータ間で「競合」や「干渉」が発生し、それがノイズやアーティファクト、あるいはプロンプトの無視といった形で現れていた可能性があります。
v13.0でDAREを適用 することは、この「干渉」を未然に防ぐことを意味します 。DAREは、両モデルの核となる知識(シグナル)を維持しつつ、マージの際にノイズとなる冗長なパラメータを事前に除去します。これにより、v13.0はv11.0よりもはるかにクリーンなマージを実現し、Illustrious v2.0の「美的感覚」を損なうことなく、NoobAI EPS v1.1の「キャラクター知識」をより純粋な形で統合することに成功したと推察されます。
1.4. v13.0の進化学的意義:「キャラクター知識の調整」の検証
この技術的背景は、v13.0の公式な変更点が「Adjust some character knowledges(いくつかのキャラクター知識の調整)」 とされている理由を明確に説明します。
v11.0の公式な目的は「キャラクターとポーズの知識を 拡張する (extending)」ことでした 。しかし、前述の通り、v11.0の「hybrid」マージ では、その「拡張された知識」がマージノイズによって不安定だったり、Illustriousのベース知識と干渉して発現しなかったりした可能性があります。
v13.0は、DARE を用いてこの「干渉」を取り除き、v11.0で 意図したものの、ノイズに埋もれていた「キャラクター知識」が、よりクリーンに、より安定して発現するように「チューニング」しました。
したがって、v13.0の変更は「知識の 追加」ではなく、「知識の 調整 (Adjust)」 という表現が最も的確です。これは、v11.0の潜在能力を100%引き出すための論理的な「リファイン(洗練)」であり、v11.0からの明確な「進化」と言えます。
表1:Nova Anime XL IL v11.0 vs v13.0 主要諸元比較
| 項目 | Nova Anime XL IL v11.0 | Nova Anime XL IL v13.0 | 分析(v13.0での進化) |
|---|---|---|---|
| ベースモデル | Illustrious | Illustrious | 変化なし。 Illustriousの系譜を継承。 |
| マージ構成 | NoobAI EPS v1.1 + Illustrious v2.0 stable hybrid core system | NoobAI EPS v1.1 + Illustrious v2.0-stable DARE applied | 核心的変更点。 構成要素は同一だが、マージプロセスが根本的に異なる。 |
| マージ技術 (推論) | 加重平均 / ブロックマージ ("hybrid" から推察) | DARE(Drop And REscale) | 技術的高度化。 パラメータの競合とノイズを体系的に低減。 |
| 公称変更点 | キャラクターとポーズの知識を 拡張 | いくつかのキャラクター知識を 調整 | 拡張から調整(純化)へ。 v11.0の不安定な知識を、DAREによって安定化・明確化。 |
第2部:v13.0におけるプロンプト・フレームワークの最適化
第1部で特定した「アーキテクチャの純化」は、v11.0 PDF で確立された実践的なプロンプト技術に直接的な影響を与えます。
2.1. BREAKコマンドの有効性の再検証
v11.0 PDFの分析において、[品質タグ], [主題], BREAK, [雰囲気/構図タグ] という三部構成プロンプトは、モデルの性能を引き出す上で不可欠な要素とされました 。BREAKコマンドは、主題と構図の概念が「混ざり合う」ことを防ぐ「手動によるアテンション制御」として機能すると結論付けられています 。
v13.0の公式推奨プロンプト(Illustrious版)は、以下の通りです。 masterpiece, best quality,... {Prompt}, BREAK, depth of field, volumetric lighting
これは、v11.0 PDF で分析された構造と 完全に一致 しています。
この事実は、v13.0がv11.0のプロンプト技術(Danbooruタグベースの語彙 と概念的分離の必要性)を100%継承していることを示します。v11.0で習得したプロンプト資産は、v13.0でも完全に有効です。
さらに、第1部で論じたように、v13.0がDARE によってノイズが低減され、プロンプトへの感度(忠実度)が向上していると仮定するならば、BREAKコマンド の重要性はv11.0以上に高まっていると考えられます。v11.0では曖昧に解釈されたかもしれないプロンプトが、v13.0ではより厳密に解釈されるため、BREAK を用いた概念の「明確な分離」 が、v13.0のクリーンな出力を引き出すための鍵となります。
2.2. v13.0 推奨パラメータの分析
v13.0(Illustrious版)の公式推奨設定は、Sampler: Euler a, Steps: 20~30, CFG Scale: 4~6 です 。
v11.0 PDF では、モデルの「得意領域」である2.5Dスタイルの推奨CFGが 4-6、アニメスタイルが 5-7、そして「弱点」であるフォトリアルが 3.5-5 と分析されていました。
v13.0の公式推奨CFG 4~6 が、v11.0の「得意領域」の推奨値 と完全に一致することは、モデルの基本的な「反応曲線」が変わっていないことを示します。
v11.0 PDF は、高いCFGが「過剰に作り込まれた」イラスト感を生むと指摘していました。v13.0の推奨値が 4~6 という比較的低い範囲に設定されていることは、このモデルが低いCFG値でもプロンプトに十分追従することを示唆しています。これは、DARE によるマージ効率化(ノイズ低減によるシグナルの明確化)の直接的な恩恵と考えられます。
ユーザーは、v11.0よりも低いCFG(例:4.5)で、v11.0のCFG 5.5と同等以上のプロンプト忠実度と、よりアーティファクトの少ない(破綻の少ない)出力を得られる可能性があります。
第3部:v13.0 スタイル別マスターガイド(v11.0 PDFとの比較分析)
v11.0 PDF で定義された主要5スタイルが、v13.0のアーキテクチャ変更(DAREによる純化)によってどのように変化したかを、技術的特性に基づき分析・予測します。
3.1. 2.5D「セミリアル」:得意領域のさらなる洗練
- v11.0の評価: イラスト風キャラクターとリアルな照明を融合させた、モデルが最も得意とし、そのために設計された領域 。
- v13.0での進化予測: DARE によるノイズ低減は、この「デフォルト」スタイルの安定性を最も直接的に向上させます。v11.0の「hybrid」マージ で見られたかもしれない僅かなディテールの破綻(例:装飾品と肌のブリーディング)が減少し、volumetric lightingやdepth of fi[span_52](start_span)[span_52](end_span)eld といったBREAK以降の構図タグの反映が、よりクリーンかつ強力になると期待されます 。v13.0は、v11.0の95点の出力を、より安定して99点にするモデルであると推察されます。
3.2. アニメ&セル画:公称される「知識調整」の真価
- v11.0の評価: 本来の得意分野。ただし、v11.0 PDF は、anime screencapなどの特定のタグスタッキング が必要であり、またDanbooruタグの冗長性(cel shadingタグの要否)についての議論も指摘していました 。
- v13.0での進化予測: ここが「Adjust some character knowledges」 の真価が問われる領域です。DARE によるパラメータの「調整」により、v11.0で干渉していたタグがv13.0ではより明確に分離・解釈される可能性があります。例えば、v11.0 PDF で議論された「cel [span_17](start_span)[span_17](end_span)shadingとanime col[span_18](start_span)[span_18](end_span)oringが冗長か否か」という問題は、v13.0では「両者を使い分けることで、より明確なスタイル制御が可能になる」という形で解決されているかもしれません。特定のキャラクターや衣装、髪型(例:v11.0 PDF の「ツインテール」)のプロンプトが、より少ない試行回数で、より正確に再現されることが期待されます。
3.3. フォトリアリズムへの挑戦:「弱点」は克服されたか
- v11.0の評価: 「最大の課題」であり、「真の写実主義に積極的に抵抗する」 。
- v13.0での進化予測: 弱点は克服されていません。 v13.0のベースはv11.0と同じIllustriousであり 、変更点であるDARE は 存在しない知識(フォトリアルな肌の質感など)を新たに追加する技術ではありません 。むしろ、DARE によって「Illustrious」と「NoobAI」(どちらもアニメ系)の知識が 純化 されることで、モデルの「アニメ/イラスト」へのバイアスはv11.0より さらに強固 になっている可能性があります。したがって、v13.0でのフォトリアリズム生成は、v11.0 と同様、あるいはそれ以上に困難です。v11.0 PDF で推奨された強力なネガティブプロンプト((anime:1.5), (illustration:1.5)など)が引き続き、あるいはより高い強度で必要になるでしょう。
3.4. 壮大なファンタジーおよびSFアート:複雑な構図の安定性
- v11.0の評価: aesthetic, ultra-detailedといったバイアスを活用する「もう一つの大きな強み」 。
- v13.0での進化予測: 2.5Dスタイル(3.1)と同様、DARE による恩恵が期待されます。ファンタジーアートは、キャラクター、背景、魔法エフェクトなど、多数の概念が混在する複雑なプロンプトを必要とします。v11.0 の「hybrid」マージでは、これらの概念が「混ざり合う」可能性がありました。v13.0 のクリーンなマージは、この「概念の混濁」を抑制し、BREAKコマンド による主題と背景の分離をより強固に実行すると期待されます。
3.5. 3DCG(様式化レンダリング)
- v11.0の評価: v11.0 PDF は、モデルが目指す「3D」とはフォトリアルなものではなく、「原神」のような「様式化された3DCGのルック」であると正しく指摘しています。
- v13.0での進化予測: v13.0も「Anime/2.5D/3D」を謳っています 。DARE によってアニメ調の知識が純化されたことで、3d render, cgiといったプロンプトは、v11.0よりもさらに「クリーンで、洗練されていながらも、明確に非写実的」な、まさにv11.0 PDF が定義した通りの「様式化された3DCG」を生成するよう最適化されていると考えられます。
表2:v13.0 スタイル別推奨パラメータ(v11.0 PDFからの更新)
| スタイル | 推奨 サンプラー | ステップ数 範囲 | CFGスケール 範囲 | v13.0における分析と推奨 (v11.0からの変化) |
|---|---|---|---|---|
| 2.5D (セミリアル) | Euler a | 20-30 | 4.0-6.0 | 分析: v11.0のスイートスポット と同じ。 DARE により、この範囲(特に低めの5.0以下) での安定性と忠実度が向上。 |
| アニメ (キャプチャ風) | Euler a | 20-25 | 5.0-6.0 | 分析: v11.0のCFG 5-7 よりやや低い値を推奨。 DARE による知識の「調整」 により、 スタイルを強制するための高いCFGが 不要になった可能性。 |
| ファンタジーアート | Euler a / DPM++ 2M Karras | 25-35 | 4.5-6.0 | 分析: 複雑な概念の混濁を防ぐため、 CFGはBREAKコマンドの分離が効く 6.0以下に抑えるのが賢明。 |
| フォトリアル (挑戦) | DPM++ 2M Karras | 30-40 | 3.5-5.0 | 分析: v11.0 の設定を流用。 ただし、DARE によりモデルのアニメバイアスが 強化されている可能性があり、 v11.0以上に強力なネガティブプロンプト ((anime:1.6)など)が必須。 |
第4部:【ケーススタディ】キャラクター生成能力の比較:アスカ・ラングレーの再描画(理論的検証)
v11.0 PDF は、キャラクターLORAを使用せず、モデルの核となる知識のみで「アスカ・ラングレー」を描画する5つのプロンプト例を提示しました。これは、モデルの「キャラクター知識」の深さと安定性を測るための優れたベンチマークです。
v13.0の作例ギャラリーにはアスカの直接的な比較対象が存在しない ため、本セクションでは、第1部で特定したv13.0の技術的特性(DAREによる「キャラクター知識の調整」) に基づき、v11.0のプロンプトをv13.0で実行した場合に 期待される結果 を理論的に分析・予測します。
4.1. v11.0の課題(推測)
v11.0 PDF のプロンプトは「auburn hair tied in pig[span_36](start_span)[span_36](end_span)tails with red clips, piercing blue eyes」など、非常に詳細です。v11.0 の「hybrid」マージでは、これらの詳細な属性(Danbooruタグ)が、Illustriousの持つ一般的な「美少女」の概念と競合し、一部が脱落する(例:「red clips」が生成されない、髪色が「auburn」ではなく単なる「red」になる)可能性が常にありました。
4.2. v13.0の「キャラクター知識の調整」による改善予測
予測1:詳細な属性の忠実度向上
v13.0 のDAREマージは、この種の「知識の競合」を低減するように設計されています 。したがって、v11.0 PDF のプロンプトを実行した際、「asuka langley soryu」「a[span_70](start_span)[span_70](end_span)uburn hair」「pigtails」「red c[span_37](start_span)[span_37](end_span)lips」「blue eyes」といった複数のDanbooruタグ的属性が、互いに干渉することなく、より正確かつ安定して同時出力されると期待されます。これが「Adjust some character knowledges」 の直接的な効果です。
予測2:スタイルの安定性向上
v11.0 PDF は、スタイルごとにプロンプトとパラメータを厳密に調整していました(例:4.3 レトロスタイル vs 4.2 2.5Dスタイル)。v13.0 では、DAREによるノイズ低減により、モデルがプロンプトの「スタイル指定」(例:anime screencap:1.3 )と「キャラクター指定」(asuka langley soryu )をよりクリーンに両立できると推察されます。
結果として、v11.0では時折「2.5D」に流れてしまったかもしれないレトロスタイルの試行 が、v13.0ではより高い確率で「レトロスタイル」として、かつ「アスカ」として破綻なく出力されることが期待されます。
4.3. ケーススタディの結論
v13.0は、v11.0よりも「アスカ」に関する 新しい知識 を持っているわけではありません。v13.0は、v11.0が 既に持っていたが、マージノイズによって不安定だった「アスカ」の知識を、DARE によって より安定して、より忠実に 引き出せるように「調整」 されたモデルである、と結論付けるのが最も妥当です。
比較1:ハイパーリアルなポートレート(「生存者の眼差し」)


比較2:2.5Dシネマティック・スチル(「第3新東京市、屋上にて」


比較3:失われたエヴァンゲリオンのフィルム(「90年代レトロスタイル」)


比較4:宇宙戦争のワルキューレ(「ファンタジーアートへの再構築」)


比較5:赤とオレンジによる抽象的研究(「心理的断片化」)


第5部:結論と戦略的推奨事項
5.1. v13.0へのアップグレード評価
v11.0からv13.0への進化は、新しい機能の追加ではなく、既存の機能の「純化」と「安定化」にあります。v13.0は、v11.0 の「hybrid」マージに伴うノイズやパラメータの競合を取り除き、Illustriousベースの美学とキャラクター知識をより純粋な形で融合させた「リファイン(洗練)版」です。この進化は、DARE という高度なマージ技術の適用によって達成されました。
v11.0ユーザーは移行すべきか: 強く推奨します。 v13.0は、v11.0のプロンプト技術(BREAKコマンドなど) やパラメータ設定 の知識がすべてそのまま活かせる、完全な上位互換モデルです。v11.0で感じていた「あと一歩」の破綻や、複雑なプロンプトの特定要素が無視されるといった問題が、v13.0では改善されている可能性が非常に高いです。
v13.0の限界の再確認: v11.0 PDF で特定されたIllustriousベースの弱点、特に「フォトリアリズムの生成不可」 は、v13.0でも(あるいはDAREによる純化 によってそれ以上に)明確な限界として存在します 。
### 5.2. v13.0を習熟するための戦略的アドバイス
- v11.0のプロンプト資産を信じる: v11.0 PDF で学んだ[品質], [主題], BREAK, [雰囲気]の三部構成 は、v13.0でも黄金律です。 2. CFGスケールを再検討する: v11.0と同じプロンプトを使用し、CFGスケールをv11.0の時より少し(0.5~1.0程度)下げてみてください 。v13.0のDARE による効率化により、より低いCFGでv11.0以上のクリーンな結果が得られる可能性があります。
- 「調整された知識」を信頼する: v11.0で生成が不安定だった複雑なキャラクター(例:特定のアニメキャラ + 特殊な衣装 + 複雑なポーズ)のプロンプトを、v13.0で再試行してください。「Adjust some character knowledges」 の恩恵を最も体感できるはずです。
- 弱点に挑まない: v13.0をフォトリアリズム のために使うのは、リソースの無駄です。このモデルは、v11.0の強みであった「2.5D/アニメ/ファンタジー」の領域 で、より少ないアーティファクトで、より忠実な結果を出すために設計された「純化された特化モデル」として活用してください 。
引用文献
1. Nova Anime XL - IL v13.0 | Illustrious Checkpoint | Civitai, https://civitai.com/models/376130?modelVersionId=2392184 2. Nova Anime XL - SeaArt AI Model, https://www.seaart.ai/models/detail/014438464feaafee6efd4452cb1c768b 3. Nova Anime XL IL v11.0 is Released! : r/civitai - Reddit, https://www.reddit.com/r/civitai/comments/1n62i7q/nova_anime_xl_il_v110_is_released/ 4. Nova Anime XL IL v13.0 is Released! - civitai - Reddit, https://www.reddit.com/r/civitai/comments/1oswsmm/nova_anime_xl_il_v130_is_released/ 5. Evolutionary Optimization of Model Merging Recipes - arXiv, https://arxiv.org/html/2403.13187v1 6. Model Merging and You, https://planetbanatt.net/articles/modelmerging.html 7. DARE the Extreme \faRunning: Revisiting Delta-Parameter Pruning For Fine-Tuned Models, https://arxiv.org/html/2410.09344v1 8. From Task-Specific Models to Unified Systems: A Review of Model Merging Approaches, https://arxiv.org/html/2503.08998v1 9. [2403.02799] DPPA: Pruning Method for Large Language Model to Model Merging - arXiv, https://arxiv.org/abs/2403.02799 10. Nova Anime XL IL v3.0 - MonAI, https://wiki.monai.art/en/models/nova_anime 11. Which do you think are the best SDXL models for anime? Should I use the newest models when searching, or the highest rated/downloaded ones, or the oldest ones? : r/StableDiffusion - Reddit, https://www.reddit.com/r/StableDiffusion/comments/1okrk54/which_do_you_think_are_the_best_sdxl_models_for/ 12. Model details - ArtBot for Stable Diffusion, https://artbot.site/info/models 13. Nova Anime XL - Search prompts for Stable Diffusion, ChatGPT & Midjourney - PromptHero, https://prompthero.com/ai-models/nova-anime-xl-download 14. Best all-round Illustrious checkpoint for 2-D fiction/non-realism? : r/StableDiffusion - Reddit, https://www.reddit.com/r/StableDiffusion/comments/1l9iico/best_allround_illustrious_checkpoint_for_2d/

