目次


第1部:Nova Anime XL IL v11.0の基礎分析

本セクションでは、モデルの核となる技術的アイデンティティを確立し、その挙動を理解し、潜在能力を最大限に引き出すために必要な基礎知識を提供します。

1.1. モデルのアーキテクチャと系譜

Nova Anime XL IL v11.0は、クリエイターCrody氏によって開発された、SDXL(Stable Diffusion XL)ベースのチェックポイントマージモデルであり、「Nova Series」の一部です 1。その基盤となっているのは「Illustrious」と呼ばれるベースモデルです 1。公式な説明によれば、このモデルは「キャラクターとポーズの知識を拡張する」ことを目的として設計されており、特に「アニメ/2.5D/3D」スタイルの生成に特化しています 2

このモデルの系譜を理解することは、その特性を把握する上で極めて重要です。ベースである「Illustrious」は、AIアート生成コミュニティにおいて、高品質で審美的に優れたアニメスタイルのイラストを生成する能力と、他のモデルファミリー(例えば「Pony」)と比較して優れたプロンプト追従性で知られています 4。この遺産が、

Nova Anime XLの生来の強みとバイアスを決定づけています。

さらに、このモデルが「マージ」であるという事実は、単一のデータセットでゼロから学習されたモノリシックなモデルではなく、複数の既存モデルの長所を組み合わせ、特定の知識ギャップ(キャラクターやポーズなど)を埋めるためにキュレーションされた混合物であることを示唆しています 1。この設計思想は、ベースモデルの核となる挙動はIllustriousに依存しつつ、特定の領域における柔軟性が強化されていることを意味します。したがって、このモデルを習熟するためには、まずベースであるIllustriousモデルの特性を理解することが不可欠です。このモデル用に開発されたLoRAだけでなく、Illustriousベースで学習されたLoRAも高い互換性と性能を発揮する可能性が高いと考えられます 4

1.2. 中核的特性と内在的バイアス

Nova Anime XL IL v11.0は、高品質で詳細、かつ審美的に優れたイラスト風の出力を生成することに強いバイアスを持っています。これは、公式に推奨されているプロンプト構造がmasterpiece, best quality, amazing quality, 4k, very aesthetic, high resolution, ultra-detailed, absurdresといった品質を強調するタグで満たされていることからも明らかです 1。コミュニティでの議論でも、Illustriousベースのモデルは、そのプロンプト追従性と一貫性の高さから、他の選択肢よりも好まれる傾向にあります 4

この内在的バイアスは、このモデルの最大の強みであると同時に、主要な制約でもあります。本質的に「美しく、洗練された画像を生成したい」という傾向があるため、このバイアスに逆らう試み、例えば、ざらついた質感の、ローファイな、あるいは真にフォトリアルな画像を生成しようとする場合、より多くの工夫と特定のネガティブプロンプトが必要となります。

このモデルの知識構造は、自然言語の深い理解に基づいているのではなく、Danbooruなどの画像投稿サイトで用いられる「タグ」に基づいた「概念的語彙」で構成されていると考えられます。この構造が、特定のアニメ的コンセプト(例:「ツインテール」「セーラー服」など)を非常によく理解する一方で、タグ付けが困難な概念(例:特殊で複雑な髪型、フォトリアルな肌の質感、微妙な感情表現など)の再現に苦労する理由を説明しています 6。コミュニティのユーザーは、モデルがDanbooruタグを理解するため、プロンプト内でアンダースコアを用いた複合語(例:

human_male)を使用することを推奨しています 8。これは、モデルが画像を「見る」のではなく、タグの集合体を解釈していることを示唆しています。したがって、このモデルにおける「プロンプトエンジニアリング」とは、詩的な文章を記述することよりも、望む視覚的出力を引き出すための正確な「タグエンジニアリング」に近い作業となります。

1.3. 基礎的なプロンプトフレームワーク:BREAKコマンドの解体

このモデルを効果的に使用するための最も重要な構造的要素は、公式に推奨されているプロンプトの三部構成です。その形式は[品質タグ], {プロンプト本体}, BREAK, [雰囲気/構図タグ]となっており、BREAKキーワードはこの構造において不可欠な要素です 1。この構造を無視すると、最適な結果を得ることは困難になります。

BREAKコマンドは、概念を分離するための強力なツールとして機能します。これにより、モデルはプロンプト内の異なる情報ブロックが互いに「混ざり合う」ことなく、それぞれを個別に処理することができます。これは、単純なコンマによる区切りよりも洗練されたテクニックであり、ユーザーがコンセプトを階層化することを可能にします。最初に全体的な「品質」を定義し、次に「主題」を、そして最後に「撮影技術(シネマトグラフィ)」を指定するという、論理的な構成を実現します。

このBREAKキーワードは、一種の手動によるアテンション制御として機能し、モデルのテキストエンコーダーにプロンプトの各部分を個別の重み付けされたコンテキストとして扱わせていると考えられます。コミュニティでは、この機能が複数のキャラクターを描画する際に、それぞれの特徴が混ざり合うのを防ぐためにも有効であることが発見されています 9。メタデータと主題の分離、そして主題Aと主題Bの分離という二重の用途は、

BREAKが単なる様式的なものではなく、拡散プロセスにおけるプロンプトの影響を分割する機能的な区切り文字であることを証明しています。これは、モデルがこの形式で構造化されたプロンプトを含むデータセットでファインチューニングされた可能性を示唆しており、ユーザーがプロンプト内で「サブプロンプト」を作成できる可能性を開きます。例えば、 (前景のキャラクター), BREAK, (遠景の城:0.8)のように記述することで、シーンの異なる要素に異なる重みとコンテキストを適用できる可能性があります。


第2部:表現スタイル別マスターガイド

本セクションでは、公式のガイダンスとコミュニティから得られた技術を統合し、5つの主要な表現スタイルを生成するための詳細かつ実践的な情報を提供します。各スタイルにおけるモデルの特定の長所と短所にも焦点を当てます。

2.1. フォトリアリズムへの挑戦:イラストモデルの限界を押し広げる

フォトリアリズムの生成は、このモデルにとって最も大きな課題です。その核となるIllustrious/アニメの特性が、真の写実主義に積極的に抵抗します。コミュニティからのフィードバックは明確で、このカテゴリーのSDXLモデルはリアリズムの生成において「非常に不安定」であり、「リアリズムに近いが、依然として顕著な違いがある」「明らかにAIが生成したように見える」画像を生み出すと報告されています 7。その出力は、しばしば様式化されたイラストと現実との間の「不気味の谷」に陥ります 10

ここでの戦略は、完璧なリアリズムを達成することではなく、モデルのアニメ的特徴を可能な限り抑制し、写真的な美学へと導くことです。

  • ポジティブプロンプトの戦略: 写真に関連する用語を強調します。プロンプトの冒頭に(photograph:1.3), realistic, 8k uhd, cinematic photoといった強い指示を与えます。さらに、shot on ARRI Alexa, 50mm lens, f/1.8, soft natural lightingのような具体的なカメラ機材や設定に関する記述、detailed skin texture, pores, imperfectionsのようなリアルな質感を表現する言葉を追加します。
  • ネガティブプロンプトの戦略: これが最も重要な部分です。モデルのデフォルトスタイルを積極的に否定する必要があります。(anime:1.4), (illustration:1.4), (painting:1.3), cartoon, graphic, 3d, render, cgi, doll, fake, cel shading, flat shading, worst quality, bad qualityといったタグを強力に指定します。Illustriousの公式ネガティブプロンプトにも、cartoon, graphic, paintingなどの有用な単語が含まれています 1
  • Automatic1111のパラメータ設定:
  • Sampler: DPM++ 2M Karras または DPM++ SDE Karras を推奨します。これらのサンプラーは写実的なスタイルに適しており、微細なディテールを良好に再現できます。
  • Steps: 30-40程度の高めのステップ数を設定し、サンプラーがディテールを解決するための十分な時間を与えます。
  • CFG Scale: 3.5-5の範囲に下げます。高いCFGスケールは、モデルがプロンプトのアニメ的な解釈に固執しすぎる原因となります。低い値にすることで、より創造的な解釈を促し、「過剰に作り込まれた」イラスト感を軽減できます。
  • LoRAの統合: 「Add More Details」のようなディテール向上系LoRAや、特定の「Realistic Skin Texture」LoRAを使用することで、ベースモデルに欠けている高周波のディテールを補うことができます。複数のLoRAを低い強度(例:<lora:details:0.3> <lora:skin:0.4>)で組み合わせることも有効です 11

フォトリアリズムの達成が困難である根本的な理由は、前述のタグベースの語彙に起因します。モデルは、現実を定義する微妙な不完全さや混沌としたディテールに対する概念的な「言葉」を持っていません。モデルが生成する「リアリズム」とは、物理法則や光の挙動を深く理解した上での再現ではなく、高度に洗練され、審美的に美しい写真に基づいた模倣に過ぎません。その結果、出力は「個性がなく、ありきたり」に感じられるのです 7。モデルは「リアル」とタグ付けされた全ての画像の「平均」を生成するため、個性的で決定的な不完全さが平滑化されてしまいます。解決策は、単にリアリズムを要求するだけでなく、モデルの理想化されたデフォルト設定をネガティブプロンプトで否定し、LoRAを用いて欠落している情報を補完することです。

2.2. 2.5D「セミリアル」な美学の習得:モデルの得意領域

イラスト風のキャラクターとリアルな照明や被写界深度を融合させたこの2.5Dスタイルは、このモデルが最も得意とし、そのために設計された領域です 2。Illustriousベースが持つ美しいキャラクターを生成する能力と、洗練された構図要素を組み合わせることで、その真価を発揮します。

  • ポジティブプロンプトの戦略: 公式のプロンプト構造に正確に従うことが鍵となります。masterpiece, best quality, amazing quality, very aesthetic, (semi-realistic:1.2), cinematic, sharp focus, {プロンプト本体}, BREAK, depth of field, volumetric lighting, film grainのように記述します。ここでBREAKは、主題と「カメラワーク」を分離するために不可欠です。
  • ネガティブプロンプトの戦略: 標準的なIllustriousのネガティブプロンプトを使用しつつ、極端な方向に寄りすぎるのを防ぐために(photorealistic:1.2), (cartoon:1.2), 2d, flat shading, painting, simple backgroundなどを追加することが有効です 1
  • Automatic1111のパラメータ設定:
  • Sampler: 公式に推奨されているEuler aが、このスタイルにおいて非常に優れた結果をもたらします 1
  • Steps: 25-35。ディテールと生成時間のバランスが取れた適切な範囲です。
  • CFG Scale: 4-6。公式推奨範囲であり、プロンプトへの追従性と創造的な自由度の完璧なバランスを提供します 1
  • LoRAの統合: 照明や映画的な効果を強化するLoRAが非常に効果的です。ボリュームライティングを強調したり、特定の種類のボケ効果を追加したりするLoRAは、2.5Dのルックをさらに向上させます。

このモデルが2.5Dで成功を収めているのは、このスタイルがその学習データの中核をなす高品質なデジタルアートの性質と完全に一致しているためです。現代のデジタルアーティストは、3Dレンダリングをベースにしてその上にペイントを施し、洗練された2.5Dのルックを作り出すことがよくあります。モデルは、この最終的な美的感覚を再現することを学習しており、事実上、プロのデジタルイラストレーターのワークフローを模倣していると言えます。したがって、rim lighting(リムライト)、subsurface scattering(サブサーフェススキャタリング)、ambient occlusion(アンビエントオクルージョン)といったデジタルアートの専門用語をプロンプトに用いることで、優れた結果が期待できます。

2.3. 本格的なアニメおよびセル画風スタイルの実現

「アニメ」モデルとして、このスタイルは本来の得意分野です。しかし、「アニメ」という言葉は広範なスタイルを指すため、現代的で高精細なイラストレーションなのか、それとも90年代のレトロな「アニメキャプチャ」なのか、といった具体的なスタイルを指定することが重要です。

  • プロンプトの戦略: ここではコミュニティで培われた知見が非常に価値を持ちます。
  • 現代的なアニメイラスト: デフォルトのIllustriousプロンプト構造を使用します。masterpiece, best quality, newest, {プロンプト本体}, BREAK, detailed background。
  • アニメキャプチャ/セル画: コミュニティによって発見された特定のタグの組み合わせが必要です。ある議論では、anime coloring, anime shading, anime screencap, cel shading, thick outlinesという組み合わせが効果的であることが示されています 12
    cel shadingはDanbooru上ではanime coloringと同じタグであるため不要だという意見もありますが 12、別のユーザーは全てのタグを追加することで「素晴らしい改善」が見られたと報告しています 12。最大限の効果を得るためには、全てのタグを組み合わせるのが最善策でしょう。
  • ネガティブプロンプトの戦略: アニメキャプチャを生成する際は、高精細さやリアリズムを示唆する用語を排除することが不可欠です。photorealistic, 3d, realistic lighting, intricate detail, hyperdetailed, soft shadingなどを指定します。
  • Automatic1111のパラメータ設定:
  • Sampler: Euler aが引き続き最良の選択です 1
  • Steps: 20-30。アニメスタイルは比較的少ないステップ数で済みます。
  • CFG Scale: 5-7。やや高めのCFGスケールは、特定のセル画スタイルを強制し、モデルがより詳細な2.5Dのデフォルトスタイルに流れるのを防ぐのに役立ちます。
  • LoRAの統合: スタイルLoRAが真価を発揮する領域です。特定のシリーズ(例:「スタジオジブリ風」)や時代(例:「レトロアニメ」)に特化して学習されたLoRAを使用することで、美的感覚を正確に制御できます。

コミュニティ内でcel shadingが必要なタグかどうかについて意見が分かれている事実は 12、Danbooruのタギングが持つ確率的で冗長な性質を明らかにしています。一部のタグは同義語かもしれませんが、他は微妙な文脈上の違いを持つ可能性があります。モデルの「理解」は、これらのタグがどのように使用されているかの統計的な集合体です。したがって、一見冗長に見えるキーワードを複数使用する「プロンプトスタッキング」は、このモデルにおいて有効かつ強力なテクニックであると言えます。これは、モデルが意図を確実に理解するように、少しずつ異なる言い方で同じ指示を繰り返すようなものです。

2.4. 壮大なファンタジーおよびSFアートの創造

これはモデルのもう一つの大きな強みであり、aesthetic, ultra-detailed, sceneryといったプロンプトに対するモデルのバイアスを直接的に活用する分野です 1。鮮やかでハイコンセプトなファンタジーやSFのイラストレーション制作に非常に優れています。

  • ポジティブプロンプトの戦略: 鍵となるのは、描写的な世界観の構築と、プロンプトの雰囲気に関する部分を最大限に活用することです。調査で見つかった優れた例として、nebulae cosmic purple eyes, red annular solar eclipse halo, glowing stars in hand... cosmic sky, aurora, chaos, perfect night, fantasy backgroundというプロンプトがあります 13。これはキャラクター描写と環境描写を組み合わせることの力を示しています。構造としては、
    masterpiece, best quality, epic, concept art, {キャラクター/主題の詳細}, BREAK, {詳細な風景/雰囲気の描写}, depth of field, volumetric lightingが効果的です。
  • ネガティブプロンプトの戦略: 標準的なIllustriousのネガティブプロンプトが有効です。ファンタジー感を確実にするために、modern, contemporary, photograph, realistic, mundane, simple backgroundを追加します 1
  • Automatic1111のパラメータ設定:
  • Sampler: Euler aが強力なデフォルトですが、非常に詳細なシーンにはDPM++ 2M Karrasも使用できます。
  • Steps: 25-35。
  • CFG Scale: 4-6。この範囲は、モデルが幻想的なコンセプトを創造的に解釈しつつ、主題の核となる部分に忠実であることを可能にします。
  • LoRAの統合: 魔法のエフェクト(glowing runes, energy blasts)や特定のテクスチャ(ornate armor)のためのLoRAが非常に効果的です。

このモデルがファンタジーアートに習熟しているのは、その学習データとなった画像掲示板に、人気ゲーム(例:原神、ファイナルファンタジーシリーズ)などに由来する膨大な量のファンタジー関連コンテンツが存在することに大きく影響されています。モデルはファンタジーの典型的な表現に関する深い視覚的ライブラリを内蔵しているのです。したがって、LoRAを使用せずとも、これらの人気フランチャイズに関連するキーワードをプロンプトに含めることで、出力スタイルに影響を与えることができる可能性があります。

2.5. 抽象的および芸術的な構図の探求

このモデルは主にイラスト生成に特化していますが、depth of fieldやvolumetric lightingといった構図に関するタグを理解しているため、より芸術的で抽象的な創作も可能です。ただし、矛盾したプロンプトによって混乱することがあります 8

  • ポジティブプロンプトの戦略: 具体的な主題を控えめにし、スタイル、色、形に焦点を当てることが鍵です。アーティスト名や画材のキーワードを使用します。例:(style of [アーティスト名]):1.3, watercolor, ink wash, abstract, dynamic composition。漠然とした人影が望ましくない限り、1girlのような主題タグは削除します。「混沌と色彩の研究」「渦巻くエネルギー」「幾何学模様」といった概念に焦点を当てます。複合語のタグにはアンダースコアを使用する(ink_wash)と、追従性が向上する可能性があります 8
  • ネガティブプロンプトの戦略: 写実的な解釈を積極的に排除します。photograph, realistic, literal, 1girl, character, subject, figurative, simple backgroundなどを指定します。
  • Automatic1111のパラメータ設定:
  • Sampler: どのサンプラーでも機能しうるため、実験が重要です。
  • Steps: 20-40。望む効果によって大きく変動します。
  • CFG Scale: 3-7。低いCFGはより混沌とし、予測不可能な抽象的結果を生み出し、高いCFGは指定されたアーティストやスタイルにより厳密に従います。
  • LoRAの統合: ここではスタイルLoRAが不可欠です。特定の画風(例:「水彩画」)で学習されたLoRAが、これらのルックを達成する最も信頼性の高い方法です 5

human male/female anthroのような矛盾した芸術的プロンプトによってモデルが混乱する傾向は 8、その得意領域から外れた際に概念的理解がいかに脆弱であるかを示しています。モデルは矛盾するタグを平均化することで解決しようとし、結果としてまとまりのない出力になってしまいます。これは、複雑または抽象的な概念を扱う場合、プロンプトが非常に明確で、論理的な矛盾がない必要があることを示唆しています。このような複雑さを管理するためには、

BREAKコマンドやリージョナルプロンプティング 14 が不可欠なツールとなり、各概念を独自の論理空間に割り当てることができます。

表1:主要スタイル別パラメータおよびプロンプト比較ガイド

スタイル推奨サンプラーステップ数範囲CFGスケール範囲主要ポジティブキーワード/構造主要ネガティブキーワード推奨LoRAタイプ
フォトリアルDPM++ 2M Karras30-403.5-5(photograph:1.3), realistic, 8k uhd, shot on [カメラ名], detailed skin texture(anime:1.4), (illustration:1.4), 3d, painting, cgi, unrealisticディテール向上、リアルな肌/質感、フィルム粒子
2.5D (セミリアル)Euler a25-354-6masterpiece, (semi-realistic:1.2), cinematic, {プロンプト}, BREAK, depth of fieldcartoon, 2d, flat shading, (photorealistic:1.2)映画的照明、フィルム粒子、ディテール向上
アニメ (キャプチャ風)Euler a20-305-7anime screencap, anime coloring, cel shading, thick outlines, source_animephotorealistic, 3d, realistic lighting, intricate detail, soft shading特定のアニメスタイル (例: レトロ, ジブリ)
ファンタジーアートEuler a, DPM++ 2M Karras25-354-6epic, concept art, scenery, fantasy, {主題}, BREAK, {雰囲気}modern, photograph, realistic, mundane, simple background魔法エフェクト、装飾ディテール、コンセプトアート
芸術的/抽象的任意 (実験)20-403-7(style of [アーティスト名]):1.3, [画材], abstract, [概念], swirling colorsphotograph, realistic, literal, figurative, character特定の画材 (水彩, 油彩など)


第3部:拡張能力とニッチな応用

本セクションでは、5つの主要スタイルを超えて、モデルの全能力をより包括的に概観し、特に公式に謳われている得意分野に焦点を当てます。

3.1. アニメ、2.5D、3DCGの三位一体:比較検討

このモデルは「アニメ/2.5D/3D」の生成を目的として明確にマーケティングされています 2。アニメと2.5Dについては既に詳述しましたが、「3D」という能力については明確化が必要です。コミュニティのフィードバックとモデルのフォトリアリズムにおける苦戦を踏まえると、ここでの「3D」はフォトリアルなレンダリングを意味するものではありません。それは、現代のアニメ映画や「原神」のようなゲームに見られる、クリーンで様式化された3DCGのルックを指します。

  • 比較戦略:
  • アニメ (セル画): anime screencap, cel shadingで実現 12。フラットな色、硬い影、明確な輪郭が特徴です。
  • 2.5D (イラスト): デフォルトのスタイル。2Dのキャラクターアートと3Dの照明原理(volumetric lighting, depth of field)の融合。柔らかな陰影と詳細なテクスチャが特徴です。
  • 3DCG (様式化レンダリング): 3d render, cgi, octane render, unreal engineといった用語をプロンプトに含めつつ、(photograph:1.3), realisticをネガティブプロンプトで指定してリアリズムを否定することで実現します。これにより、モデルはクリーンで洗練されていながらも、明確に非写実的なレンダリングを生成するよう誘導されます。一部のユーザーは2Dのルックを得るために(3d, render, cgi:1.4)をネガティブプロンプトとして使用しているため 15、3Dのルックを得るにはこれらの用語をポジティブプロンプトに入れ、リアリズムを否定する必要があります。

AIアートコミュニティにおいて「3D」という言葉は文脈に依存し、再定義されてきました。このモデルにとって、それは出力形式の技術的な記述ではなく、一つの「美的ジャンル」です。モデルは真の3Dシーンを作成しているのではなく、3Dアートの「見た目」を複製しているのです。この区別は、フォトリアリズムを求めるユーザーが失望を避けるために非常に重要です。

3.2. LoRA統合によるニッチな美学の解放

ベースモデルの能力は、LoRAを通じてほぼ無限に拡張可能です。Illustriousベースは、大規模なスタイルLoRAのエコシステムによって十分にサポートされています 4。ユーザーは、独自のスタイルを確立するために3〜4つのLoRAを組み合わせて使用することが一般的です 4

  • 戦略: 複数のLoRAを使用する鍵は、慎重な重み管理です。一般的なテクニックとして、まず一つのLoRAで好みの画像を生成し、そのシード値を固定します。その後、他のLoRAを低い強度(例:0.3から0.7)で徐々に追加し、画像全体を破綻させることなくどのように影響を与えるかを確認します 11
  • ニッチなスタイルの例:
  • 水彩画: 水彩画風のスタイルLoRAを使用します。プロンプトにはwatercolor painting, wet-on-wet, paper textureなどを入れ、ネガティブプロンプトでphotorealistic, sharp lines, digital artを指定します。
  • スケッチ/グラファイト: スケッチ風のLoRAを使用します。プロンプトにはgraphite sketch, cross-hatching, charcoalなどを入れ、ネガティブプロンプトでcolor, painting, photographを指定します。
  • ちびキャラ: あるユーザーは、このモデルが「ちびキャラに最高」であると述べています 3。これは、ちびキャラ用のスタイルLoRAと
    chibi, super deformed, cuteといったプロンプトを組み合わせることでさらに強化できます。

コミュニティがLoRAの組み合わせに大きく依存している現状は、ベースモデルに対する認識の変化を示しています。もはやベースモデルはオールインワンの解決策とは見なされておらず、特定のスタイルや主題(LoRA経由)を適用するための、安定した高追従性の「キャンバス」または「エンジン」として捉えられています。ベースモデルの品質は、これらのLoRAをどれだけうまくホストし、調和させられるかによって判断されるようになっています。これは、単一のモデルにプロンプトを入力するだけではない、より高度で柔軟なモジュラー型のアート制作ワークフローの台頭を意味します。


第4部:クリエイティブ・ショーケース:アスカ・ラングレーの描画

本セクションでは、モデルと各スタイルの習熟度を示す、最大限のインパクトとバイラルポテンシャルを狙って設計された5つの完成されたプロンプトを提供します。キャラクターLoRAを使用せず、モデルの核となる知識のみでキャラクターを表現します。

4.1. アスカ:ハイパーリアルなポートレート(「生存者の眼差し」)

  • コンセプト: モデルのリアリズム能力を限界まで引き出す、ざらつきがあり、親密で、感情的に訴えかけるポートレート。バイラル要素は、鑑賞者が思わず二度見するほどの生々しい感情と、驚くほどリアルに近い品質です。
  • プロンプト: (ultra-detailed photograph:1.3), 8k uhd, raw photo, of a fierce 14-year-old german girl, asuka langley soryu, auburn hair tied in pigtails with red clips, piercing blue eyes, freckles, determined expression, slight smirk, looking directly at camera, shot on ARRI Alexa, 85mm lens, f/2.0, cinematic lighting, rim light catching stray hairs, detailed skin texture with pores and slight imperfections, wearing a simple black choker, BREAK, dark, moody background, out of focus, bokeh, film grain
  • ネガティブプロンプト: (anime:1.5), (illustration:1.5), (painting:1.4), 3d, cgi, render, cartoon, drawing, unrealistic, perfect skin, airbrushed, doll, toy, red plugsuit
  • パラメータ: Sampler: DPM++ 2M Karras, Steps: 40, CFG Scale: 4.0

リアル調のアニメ風と考えるといい感じです

4.2. アスカ:2.5Dシネマティック・スチル(「第3新東京市、屋上にて」)

  • コンセプト: 戦いを前にした静かな思索の瞬間を捉えた、クラシックな2.5Dの映画的ショット。バイラル要素は、象徴的なアニメデザインと、息をのむような映画品質の照明および雰囲気との完璧な融合です。
  • プロンプト: masterpiece, best quality, (cinematic still:1.2), semi-realistic, sharp focus, 1girl, asuka langley soryu, fiery auburn hair in pigtails, intense blue eyes, wearing iconic red plugsuit, standing on a skyscraper rooftop overlooking the city of Tokyo-3 at dusk, confident posture, hands on hips, looking out at the horizon, BREAK, dramatic volumetric lighting from the setting sun, long shadows, lens flare, depth of field with the city lights blurring into bokeh, epic and atmospheric
  • ネガティブプロンプト: (photorealistic:1.2), cartoon, 2d, flat shading, painting, simple background, ugly, disfigured, worst quality
  • パラメータ: Sampler: Euler a, Steps: 30, CFG Scale: 5.5

スーツの質感など立体感があっていいですね

4.3. アスカ:失われたエヴァンゲリオンのフィルム(「90年代レトロスタイル」)

  • コンセプト: 1995年のオリジナルアニメから抜き出された本物の高解像度フレームのように見える画像。バイラルポテンシャルは、その信憑性とノスタルジアにあり、ファンに未発見のシーンだと錯覚させることを狙います。
  • プロンプト: (anime screencap:1.3), 1990s anime style, retro anime, cel art, source_anime, from neon genesis evangelion, 1girl, asuka langley soryu, bright orange-red hair in pigtails with red interface headset, angry shouting expression, teary blue eyes, close-up shot inside an eva entry plug, anime coloring, cel shading, thick outlines, slight film grain, 4:3 aspect ratio
  • ネガティブプロンプト: 3d, realistic, photorealistic, modern anime, intricate detail, soft shading, high resolution, 4k, newest, worst quality, bad quality
  • パラメータ: Sampler: Euler a, Steps: 25, CFG Scale: 6.5

かなりアニメに近い雰囲気で出力できました

4.4. アスカ:宇宙戦争のワルキューレ(「ファンタジーアートへの再構築」)

  • コンセプト: アスカをハイファンタジーの宇宙的な舞台における、神々しい鎧をまとった戦士として再創造します。「すごい」と思わせる要素は、その壮大なスケール、精巧な鎧のデザイン、そして見事な視覚効果にあり、ファンタジーアートのコミュニティに最適です。
  • プロンプト: masterpiece, epic concept art, best quality, 1girl, a divine valkyrie inspired by asuka langley, flowing auburn hair, glowing blue eyes, wearing ornate crimson and gold valkyrie armor with angelic wing motifs, wielding a glowing spear shaped like the Lance of Longinus, floating in a cosmic battlefield, determined and powerful expression, BREAK, background of exploding nebulae and shattered planets, cosmic dust, volumetric god rays, aurora, fantasy background, ultra-detailed, absurdres
  • ネガティブプロンプト: photograph, realistic, modern, plugsuit, simple background, mundane, worst quality, bad anatomy
  • パラメータ: Sampler: DPM++ 2M Karras, Steps: 35, CFG Scale: 5.0

プラグスーツに引っ張られているのか翼もメカメカしくなりました

やはりアングルが引きになると顔が崩れやすいです

4.5. アスカ:赤とオレンジによる抽象的研究(「心理的断片化」)

  • コンセプト: アスカの内面の混乱を捉えた、芸術的で象徴的な作品。アニメのより抽象的なシーケンスから着想を得ています。バイラル要素は、その芸術的価値と、深いテーマ性を理解する熱心なファンへのアピールです。
  • プロンプト: (abstract art:1.2), style of Wassily Kandinsky and Dave McKean, a fragmented portrait of a girl's psyche, swirling shapes of crimson red, fiery orange, and deep blue, geometric chaos, hints of a girl with auburn hair and one piercing blue eye, dynamic composition, emotional, psychological, ink wash, watercolor, textured canvas, BREAK, symbolic representation of anger and vulnerability
  • ネガティブプロンプト: photograph, realistic, literal, coherent, 1girl, full body, simple, clean, worst quality, figurative
  • パラメータ: Sampler: Euler a, Steps: 30, CFG Scale: 4.5

プロンプトに入っていないので当然と言えば当然ですがアスカではなくなりました

テーマ自体が難しいですが内の感情表現など頑張ったなという感じです


第5部:結論と推奨事項

最終要約

Nova Anime XL IL v11.0は、高品質な2.5D、アニメ、そして様式化されたファンタジーイラストを生成するための最高峰のチェックポイントです。そのIllustriousベースは優れたプロンプト追従性と美的品質を提供しますが、万能モデルではありません。その主な弱点は、真のフォトリアリズムを生成することがほぼ不可能である点にあります。

理想的な使用事例

このモデルは、キャラクター中心のイラストレーション、コンセプトアート、映画的なアニメシーン、ファンアートを制作するアーティストにとって理想的です。「ArtStationのトップ作品」のような洗練された美的感覚を目指す場合に、その能力を最大限に発揮します。

上級ユーザーへの戦略的推奨事項

  1. 構造の遵守: 常にmasterpiece... BREAK...というプロンプト構造を使用してください。これはオプションではありません。
  2. タグで思考する: 最大限の精度を得るために、Danbooruスタイルのタグを用いてプロンプトを設計してください。
  3. ネガティブプロンプトの習熟: リアリズムや他のニッチな美学を試みる際には、強力なネガティブプロンプトを使用して、モデルをそのデフォルトのイラストスタイルから引き離してください。
  4. LoRAエコシステムの活用: モデルを一枚岩として扱わないでください。これを高品質なエンジンとみなし、複数のスタイル、ディテール、キャラクターLoRAと組み合わせるモジュラー型のワークフローを構築し、ユニークで一貫したビジョンを達成してください。
  5. 限界を知る: モデルの特性に逆らわないでください。真のフォトリアリズムを求める場合は、その目的に特化して学習されたチェックポイントを使用するべきです。Nova Anime XL IL v11.0は、その最も得意とすること、すなわち、類いまれな美しさと躍動感を持つイラストアートの創造に用いるのが最善です。


引用文献

  1. Nova Anime XL - IL v11.0 | Illustrious Checkpoint | Civitai, 9月 4, 2025にアクセス、 https://civitai.com/models/376130?modelVersionId=2173013
  2. Nova Anime XL IL v11.0 - IL v11.0 | Stable Diffusion Model - CHECKPOINT | Tensor.Art, 9月 4, 2025にアクセス、 https://tensor.art/models/904131449404286456
  3. Nova Anime XL - IL v11.0 | Stable Diffusion Model - CHECKPOINT | Tensor.Art, 9月 4, 2025にアクセス、 https://tensor.art/models/904221790820129265
  4. Mind sharing your best NSFW model both in anime style and realistic : r/civitai - Reddit, 9月 4, 2025にアクセス、 https://www.reddit.com/r/civitai/comments/1mrzlou/mind_sharing_your_best_nsfw_model_both_in_anime/
  5. Getting anime art style right : r/civitai - Reddit, 9月 4, 2025にアクセス、 https://www.reddit.com/r/civitai/comments/1lpb7nk/getting_anime_art_style_right/
  6. (Prefect illustrious XL) I want to generate my OC with a messy hair but with curly bangs like Tesla, but I got this (even a girl showed up) please help (prompt in 1st comment) - Reddit, 9月 4, 2025にアクセス、 https://www.reddit.com/r/civitai/comments/1mb5z51/prefect_illustrious_xl_i_want_to_generate_my_oc/
  7. What is the best way to create a realistic, consistent character with nsfw? : r/civitai - Reddit, 9月 4, 2025にアクセス、 https://www.reddit.com/r/civitai/comments/1l79ot9/what_is_the_best_way_to_create_a_realistic/
  8. Need help with a prompt, I'm not sure what to change... : r/civitai - Reddit, 9月 4, 2025にアクセス、 https://www.reddit.com/r/civitai/comments/1m74en4/need_help_with_a_prompt_im_not_sure_what_to_change/
  9. How to prompt two characters without contamination and mixing of hair colors/features/eyes, etc? : r/civitai - Reddit, 9月 4, 2025にアクセス、 https://www.reddit.com/r/civitai/comments/1ev025p/how_to_prompt_two_characters_without/
  10. Flagging as minor for making character “short height” : r/civitai - Reddit, 9月 4, 2025にアクセス、 https://www.reddit.com/r/civitai/comments/1krm9k3/flagging_as_minor_for_making_character_short/
  11. Can you combine multiple LoRAs ? : r/civitai - Reddit, 9月 4, 2025にアクセス、 https://www.reddit.com/r/civitai/comments/1gf1hnu/can_you_combine_multiple_loras/
  12. Nova Anime XL IL v11.0 is Released! : r/civitai - Reddit, 9月 4, 2025にアクセス、 https://www.reddit.com/r/civitai/comments/1n62i7q/nova_anime_xl_il_v110_is_released/
  13. Nova Anime XL IL v11.0 - IL v11.0 | image created by MAC | Tensor.Art, 9月 4, 2025にアクセス、 https://tensor.art/images/904131420413267295?model_id=904131449404286456
  14. WAI-NSFW-illustrious-SDXL artworks : r/civitai - Reddit, 9月 4, 2025にアクセス、 https://www.reddit.com/r/civitai/comments/1mobsi6/wainsfwillustrioussdxl_artworks/
  15. How Can I replicate this Artstyle? : r/civitai - Reddit, 9月 4, 2025にアクセス、 https://www.reddit.com/r/civitai/comments/1kc07x3/how_can_i_replicate_this_artstyle/