技術 約42分で読めます

Animaで正面+インテーク両立するキャラを探して、自前キャラLoRA学習データ用の正面画像生成まで

いけさん目次

昨日のインテーク移植実験 で名雪由来の大インテークを汎用キャラに移植するレシピ(J/AC)が取れたが、そのまま自前キャラLoRAの訓練データに使うには問題がある。
出力が3/4ビューと斜め上から(AC構図)に偏っていて、真正面ビューが足りない。LoRA訓練データには正面・斜め・横顔の角度が一通り欲しい。

正面で名雪のインテークを出す技術的経路としては以下がある。

  1. インペイント分業(正面ベース絵 + 前髪領域だけインテーク追加)
  2. ControlNet OpenPose で骨格を渡して正面を強制
  3. 別キャラ参照に切り替えて、正面構図でもインテークが出やすいキャラを探す

1と2はローカル環境(M1 Max)では生成が重すぎてLoRA訓練データ枚数を揃えるのが現実的でない。
本記事は3の方向に切り替えて、Anima訓練データ上で「真正面ビューでもインテークが綺麗に出る」キャラを探し、そのキャラのレシピをLoRA訓練データ収集のベースに据えるまでを記録する。

候補キャラの選定基準

Anima訓練データ上で正面+インテーク両立しやすそうなキャラの選定軸は次のとおり。

  • そもそもインテーク持ちであること(Danbooru hair intakes タグで学習されている)
  • 公式絵の中で正面構図の比率が高いこと(アイドル系のステージ絵やキャラセレ立ち絵が多いキャラは正面が多いはず)
  • Animaの訓練データに十分なサンプル数があること(マイナーすぎると識別解像度が低い)
  • デザインの一貫性があること(時期によってインテークが「あったりなかったり」するキャラは安定しない)
  • 女性キャラであること(汎用「女の子」LoRAベースなので、男性キャラの参照は身体特徴の剥がしが余計)
  • FGO/ブルアカ/アズレン系は除外(昨日のV/トキ結果からアイデンティティ剥がしが重い、または独自意匠が固い)

検討候補と除外理由を一気に整理する。

キャラ作品判定理由
最上静香ミリマス✅ 採用中型インテーク、デザイン一貫、正面ステージ絵豊富
夢見りあむデレマス✅ 採用尖ったインテーク、最近寄り、デレマス10周年で訓練データ厚い
アンジュ・カトリーナにじさんじ✅ 採用尖ったインテーク明確、にじさんじ人気VTuber
木之本桜CCさくら✅ 採用前髪+サイドロック構造、30年二次創作蓄積、デザイン一貫
牙崎漣SideM❌ 除外男性キャラ、身体特徴の剥がしが余計
高槻やよい765AS❌ 除外初期(2005)デザインにインテークなし、後期で追加、訓練データに古い絵が混ざって不安定
天空橋朋花ミリマス❌ 除外同人だと尖ってるが公式デザインだと微妙、一貫性に欠ける
神尾観鈴AIR❌ 除外片側だけインテーク、左右対称性なし
アストルフォFate/Apocrypha❌ 除外男性キャラ扱い、FGOで識別アイデンティティ剥がしが重い
ネロ・クラウディウスFate/Extra❌ 除外昨日V条件で剥がし重いの確定
水瀬名雪・水瀬秋子・美坂香里Kanon△ 保留前回実験で動作確認済み、ただし今回は「最近寄り+正面構図豊富」が主旨なので一旦除外

採用4キャラの内訳。

キャラ役割
最上静香アイドル系・正面率の代表枠、ミリマスPの確度
夢見りあむ尖りインテークの最近寄りアイドル枠
アンジュ・カトリーナ最近寄りVTuber枠、インテーク強度トップクラス
木之本桜古典枠、訓練データ蓄積量の代表

アイドル系3 + 古典1の構成、インテーク強度は中型〜尖りまで幅を取る。

実験フェーズ1 最小プロンプトで各候補の現状を確認

各候補を最小プロンプト(昨日の名雪テストと同じ手順)で生成して、以下を確認する。

  • Animaがキャラを認識しているか(4枚中4枚で本人が出るか)
  • インテークが出ているか、サイズはどの程度か
  • 構図の偏り(正面/3/4/側面のどれに寄るか)
masterpiece, best quality, score_7, safe,
1girl, solo, [character_tag], [series_tag],
upper body, looking at viewer, simple background

最上静香 (mogami shizuka, idolmaster)

静香テスト1。黒髪+青目、ミリマス制服(青ジャケ+白ブラウス+青リボン)、ほぼ正面、両側薄いインテーク 静香テスト2。手を組んだ正面ポーズ、同様の構成、薄いインテーク 静香テスト3。3/4寄り正面、ミリマス制服、両側薄いインテーク 静香テスト4。笑顔、ハート背景、ミリマス制服、薄いインテーク

4枚中4枚で本人確実。構図は3/4ぎみだが正面寄りに収まる。
インテークは控えめ(中型、前髪両側にうっすら前向きの毛束あり)。
ミリマス制服(紺ジャケット+白ブラウス+青リボン)が一貫。

夢見りあむ (yumemi riamu, idolmaster cinderella girls)

りあむテスト1。ピンク+水色グラデ髪、赤目、悪魔ホーン、フリル衣装、完全正面 りあむテスト2。ピンク+水色髪、ぴょこ、首輪、ハート柄シャツ、完全正面 りあむテスト3。悪魔ホーン+ホワイトフリル、ハートエプロン、完全正面 りあむテスト4。ホーン+フリル衣装、ハートエプロン、完全正面

4枚中4枚で本人確実、4枚すべて視線正面で完全正面
インテークは前髪両側のピンク部分が尖って前向きのスクープに近い形になっている、中型程度。
水色は毛先のインナーカラー(グラデーション)であってインテーク構造とは別軸の装飾。
衣装意匠(悪魔ホーン、ハート柄、首輪、ピンク+水色フリル)が多くて剥がし負荷は重め。

アンジュ・カトリーナ (ange katrina, nijisanji)

アンジュテスト1。赤髪+三角クリップ+青目、赤ジャケット+三角ペンダント+金トリム、完全正面、明確な前向きスクープ アンジュテスト2。指差しポーズ、赤ジャケット、明確なインテーク、完全正面 アンジュテスト3。完全正面、赤ジャケット+黒+金トリム、両側に明確な前向きインテーク アンジュテスト4。笑顔、完全正面、赤ジャケット、両側に明確なインテーク

4枚中4枚で本人確実、4枚ともほぼ正面寄り(ただし小首傾げ気味で完全直視ではない)。
両側の前髪に明確な前向きのスクープが立ち上がっている、4キャラ中で最強のインテーク強度。
衣装意匠(赤ジャケット+黒+金トリム+三角ペンダント+三角クリップ)は剥がし要素が多い。

木之本桜 (kinomoto sakura, cardcaptor sakura)

桜テスト1。茶髪ショート+白カチューシャ+赤ポンポン、緑目、CCS友枝小制服、3/4寄り 桜テスト2。同様、CCS制服、3/4寄り、ハート背景 桜テスト3。笑顔、CCS制服、3/4寄り 桜テスト4。人差し指ポーズ、CCS制服、3/4寄り

4枚中4枚で本人確実、小学生の桜+友枝小制服(黒+白セーラー)+白カチューシャ風の頭巾+赤いポンポン2個。
構図は3/4より斜め寄りで、顔がだいぶ横を向いていて完全正面ではない。
インテークは頭頂部寄り(こめかみより上、髪の生え際付近)から前向きに毛束が2本立ち上がっていて、ショート髪で小ぶりではあるが構造としては明確に出ている。アホ毛も付随。
4枚すべてで髪型・衣装・年齢感はぶれず、桜本人のアイデンティティはAnima内部で固く定着している。

フェーズ1サマリ

キャラ認識インテーク構図衣装剥がし負荷
最上静香△中型3/4寄りの正面軽(ミリマス制服)
夢見りあむ◯中型(ピンク部分)✅ 完全正面重(ホーン・ハート・グラデ髪)
アンジュ・カトリーナ✅✅✅✅明確ほぼ正面(小首傾げ気味)中(赤ジャケット+金トリム)
木之本桜△小ぶり斜め寄り(顔が横向き気味)中(CCS制服)

総合の上位は アンジュ・カトリーナ。インテーク強度・正面率・認識精度すべてトップ。
次点で 夢見りあむ(正面率は最良、インテークはアンジュより一段弱い)。
静香と桜は中型インテーク寄りで、フェーズ2に進む前提では一旦保留。

朝倉由夢の保険は不要(アンジュとりあむで十分な強度が取れる見込み)。

実験フェーズ2 AC構図に Jレシピ風で移植してみる

フェーズ1でインテーク強度・正面率ともにトップだった アンジュ・カトリーナ夢見りあむ の2人で、AC構図(from above, slightly turned to the side, almost front view)とJレシピ(NL参照 + ネガでアイデンティティ剥がし + ウェイト1.5)を組み合わせる。
ベースプロンプトは汎用金髪キャラで、昨日J/ACで使ったものと同じ。NL文の like minase nayuki from kanon (game) 部分を選定キャラに置き換え、ネガにそのキャラの固有色・衣装・装飾を書き出す。

AC-アンジュ(like ange katrina from nijisanji 経由)

ネガに ange katrina, red hair, red jacket, white collar, gold trim, gothic outfit, star pendant, triangle pendant, hair clip を追加。

AC-アンジュ1。斜め上から、ほぼ正面、両側に明確な前向きインテーク、頭頂ブレイド+青リボン、金髪、白ノースリーブ+カラフルアクセント AC-アンジュ2。同様、白ノースリーブ、明確な両側インテーク、金髪 AC-アンジュ3。両側インテーク健在、白ノースリーブ+黒アクセント、3/4寄りだが頭頂ブレイドあり AC-アンジュ4。両側インテーク、ほぼ正面、白ノースリーブ+カラフル装飾

4枚中4枚で構図AC維持、4枚中4枚で 明確な両側インテークが前髪両脇に立ち上がる
昨日J(名雪版)と比べてもインテーク強度は同等かそれ以上、しかも安定して4枚中4枚で出る。
赤髪・赤ジャケットはネガで剥がせて、金髪+白ノースリーブ系の汎用キャラになっている。
ただし三角クリップが3/4で残っている(ネガに hair clip を入れたが効果が薄い、triangle hair clip 等のより具体的なタグが要る)。
前髪は完全なぱっつんではなく、姫カット気味の構造(前髪+両側分離)。アンジュ自体の前髪が分離型なので、その影響と判断する。

AC-りあむ(like yumemi riamu from idolmaster cinderella girls 経由)

ネガに yumemi riamu, pink hair, cyan hair, multicolored hair, gradient hair, devil horns, demon horns, heart pattern, heart ornament, frilly outfit, gothic lolita, choker を追加。

AC-りあむ1。金髪+毛先に水色グラデが漏れ、白Tシャツ、薄いインテーク AC-りあむ2。同様、毛先水色、白Tシャツ、薄いインテーク AC-りあむ3。同様、毛先水色グラデ、白Tシャツ、薄いインテーク AC-りあむ4。同様、目色が紫寄りに漏れ、毛先水色、白Tシャツ

4枚中4枚で構図AC維持、頭頂ブレイドOK。
インテークはACアンジュよりかなり弱く、サイドロックの立ち上がり程度。
衣装はホーン・ハート柄・フリル等を剥がせて白Tシャツ系の汎用化に成功。
しかし 毛先の水色インナーカラーが4枚中4枚で漏れる。ネガに cyan hair, multicolored hair, gradient hair を入れたが効果が薄い。
4枚目では目色も紫寄りに漏れている(りあむの目色violet/pinkがにじみ出てきた)。

不思議なのは、りあむ単体(フェーズ1の最小プロンプト)だと前髪の尖り(インテーク的構造)はかなりはっきり出ていたのに、移植プロンプトに混ぜた瞬間にインテークが弱まる現象。
アホ毛は逆で、ベースプロンプトで指定していないのに4枚すべてに残る。
仮説として、アホ毛は単純な独立装飾要素なので汎用キャラのコンテキストにも普通に乗るのに対し、インテークは前髪全体の構造変更を要するのでベースの blunt bangs 指定と衝突して薄まる、と判断する。
あるいはAnima内部で「インテーク特徴」がKanon集団の事前分布と強く結合していて、like riamu 参照ではその事前分布までは届きにくい、というのもあり得る。

フェーズ2の結果整理

衣装の学習構造に2キャラで明確な差があった。

キャラ学習構造
アンジュVTuberのLive2D/3Dデフォ衣装(赤ジャケット系)に学習が一極化していて、衣装意匠が固い反面、髪色・目色は普通に剥がせる
りあむデレステで複数衣装を着る → Anima学習も衣装多パターン → どの衣装が出るか予測しにくいが意外と普通に剥がせる、ただし髪色グラデと目色は固い

LoRA訓練データのベースとしての評価。

アンジュりあむ
インテーク強度(AC適用後)✅✅ 4枚中4枚で明確な前向きスクープ△ 4枚中4枚で薄い
髪色剥がし✅ 赤髪→金髪OK✗ 毛先水色グラデ漏れ
目色剥がし✅ 青目維持△ 紫漏れのシードあり
衣装剥がし△ 三角クリップ漏れ、要追加ネガ✅ ホーン・ハート剥がしOK
構図安定性✅✅ 4枚中4枚でAC構図✅✅ 4枚中4枚でAC構図

総合で アンジュ上位。インテーク強度がそもそも違う上、髪色・目色の剥がしが綺麗で汎用キャラとして仕上がる。
りあむはインテークが弱い時点で訓練データ用としては候補から外す。アンジュで本格的に詰める方向に進む。

実験フェーズ3 アンジュ参照で真正面ビューが出るか

フェーズ2でアンジュ採用が固まったので、LoRA訓練データに必須の 完全正面 でインテーク+ブレイドが両立するかを単独でテストする。
昨日のM/O/P実験では「正面+ハーフブレイド+インテーク」が同時に出にくかったが、参照キャラがアンジュに変わると挙動が変わる可能性がある。
構図指定を front view, facing viewer, upper body, looking at viewer に切り替え、ネガに profile, from side, three quarters view を追加。
NL参照とアイデンティティ剥がしはAC-アンジュと同じ(昨日のMでも looking up 系は使わないので落として、triangle hair clip をネガに追加)。

正面-アンジュ1。やや斜め、両側に明確なインテーク、金髪、白オフショル+ゴールド襟+カチューシャ、三角クリップ残存 正面-アンジュ2。3/4寄り、両側インテーク健在、白ブラウス 正面-アンジュ3。赤髪が漏れた失敗例、両側インテーク強、白オフショル、ネガに red hair あったがシードで剥がし不能 正面-アンジュ4。やや斜め、両側インテーク、金髪、白オフショル+青系装飾

front view, facing viewer を指定したが、4枚すべてで顔が 完全な正対ではなく若干〜明確に斜めにずれている。今欲しい「真正面(LoRA訓練データ用)」とは別物。
インテークは4枚中4枚で両側に立ち上がるが、構図はAC寄りで真正面ではない。
さらに1/4(F-03)で アンジュの赤髪がネガを抜けて漏れた。ネガに red hair を入れていてもシードによっては効果が出ず、アイデンティティ漏れが起きる。
三角クリップも依然として残るシードあり、アンジュのアイデンティティが想定より強く定着している可能性がある。

つまり正面-アンジュ単独では「真正面+インテーク両立」のLoRA訓練データを直接揃えられない。
学習データの一部としては使えるが、別の角度(特に左右対称な斜め=鏡像構図)と組み合わせる必要がある。

この時点では アンジュ採用で確定 とは言えない。正面-アンジュは構図の偏り(右側を向く斜め)が強くて、左右対称性のある訓練データセットには鏡像構図の追加生成や、別キャラを併用した補強が要る。

さらに前髪の形が問題。
こちらが指定したベースキャラは blunt bangs を持つキャラのつもりだが、正面-アンジュ出力は4枚中4枚で 前髪が中央分けで2つに分かれた構造 になっている。これはアンジュ本人の前髪(中央分け+両側落とし)の特徴が、like ange katrina NL参照経由でそのまま持ち込まれている。blunt bangs を明示指定しても効果が薄い。
ベースキャラの方向違いの感じが強く、LoRAの訓練データとして使うには前髪構造の不一致を解消する必要がある。

アンジュの代替・併用候補として、ハーフアップを既に持っている 静香 をAC構図に乗せてインテークを強めに引き出す方向も並行で確認する。

条件AD 静香ベースで AC構図 + ウェイト1.8 + 金髪化+ブレイド追加

静香はフェーズ1の最小プロンプトでハーフアップ髪型を既に持っていて、ぱっつん寄りの前髪、ミリマス制服も衣装意匠としては軽め。「ハーフアップ→ハーフブレイドアップ」への変更は braid を足すだけで済む派生で、アンジュより自然に汎用キャラに乗ると予想して試す。
ポジティブのNL末尾を like mogami shizuka from idolmaster million live に差し替え、ウェイトは1.5→1.8に上げる。ネガには静香の黒髪・ミリマス制服を剥がす要素を追加。

AD-静香1。金髪+ハーフアップ+青リボン、姫カット寄り前髪、薄いインテーク、青系ワンピース AD-静香2。金髪+ハーフアップ、姫カット寄り前髪、薄いインテーク、白ブラウス+紺ジャンパー AD-静香3。金髪+ハーフアップ+青リボン、薄いインテーク、青系ワンピース、前髪やや中央分け AD-静香4。金髪+ハーフアップ青リボン+襟元にも青リボン、ぱっつん前髪、薄いインテーク、青ワンピース

4枚中4枚で金髪化成功(静香の黒髪はネガで剥がせた)。ハーフアップ+青リボン構造は維持、衣装は青系ワンピース・ジャンパースカート系のミリマス風青系制服クラスタに収束した。
ぱっつん前髪は4でほぼきれいに出ていて、1〜3はまだ姫カット寄り。それでもアンジュ参照(中央分け+クロス前髪)よりは目標寄りの出方になっている。
インテークはウェイト1.8入れても弱〜中型、静香自体のインテークが控えめサイズなのでアンジュほど大きくは伸びない。

アンジュ vs 静香のトレードオフ。

アンジュベース静香ベース
インテーク強度✅ 強△ 中
前髪の方向違い感✗ 中央分け+クロスで方向違い✅ ぱっつん寄りに出やすい
衣装剥がし負荷△ 三角クリップ等が残る✅ 軽い、青系制服に収束
構図の偏り✗ 右斜め寄り、真正面取れない△ 3/4寄り、ぱっつんシードで正面寄り
髪色剥がし✅ 赤→金✅ 黒→金

総合的に 静香ベースの方が描きたかった汎用キャラに近い。アンジュはインテーク強度トップだが他の要素の方向違い感が強くて、訓練データ用ベースとしては微妙。
静香方向で更に叩いてインテークサイズを伸ばせるか、次に試す。

条件AE 静香ベースを叩き上げる(ウェイト2.0 + NL強化)

ADの構成を据え置きで、(hair intakes:1.8)(hair intakes:2.0) に上げ、NL文を「very prominent sharp forward-facing intake locks … clearly defined at the temples and pointing forward」に強化。
さらに (blunt bangs:1.2) で前髪をぱっつん側に寄せ、ネガに center parted bangs, parted bangs を追加してクロス前髪を抑止。

AE-静香1。ハーフブレイド+青リボン、ぱっつん前髪、両側に薄いインテーク、青ブラウス AE-静香2。ハーフアップ+青リボン、ぱっつん前髪明確、薄いインテーク、青ワンピース AE-静香3。ハーフアップ+青リボン、ぱっつん前髪、薄〜中型インテーク、青ベスト+白ブラウス AE-静香4。ハーフアップ+青リボン、ぱっつん前髪、薄いインテーク、青ワンピース

インテークサイズはAD比でほぼ横ばい、ウェイト2.0でも目立った増加なし。
前髪は (blunt bangs:1.2) + ネガに center parted bangs を入れても4枚中4枚でまだ姫カット寄りで安定する。ADと比べて明確にぱっつん化したとは言えない。ハーフブレイド+青リボンは4枚中4枚で出ている。
構図は3/4寄りで完全正面ではない。

静香自体のインテークがAnima訓練データで「中型」に固定されていて、ウェイトを上げても上限がある、ことが分かった。
昨日のJ2でウェイト2.0でもインテークがJ条件の上限で頭打ちになった現象の、静香版が同じ形で再現された。インテーク強度をアンジュ並みに引き上げるには、静香参照だけでは限界がある。

1キャラ参照で抜け出せないトレードオフ

ここまででAC構図 + Jレシピ的アプローチでは、参照キャラ次第で以下のトレードオフから抜け出せない。

方向特性
アンジュ方向インテーク強 + 前髪/衣装/構図が方向違い
静香方向インテーク上限=中型 + 前髪/衣装/構図はマシ

これ以上1キャラ参照で詰めても解決しにくいので、次は ハイブリッド正面強制側をAnima内部で何とかするか の判断が要る。

候補は4つ。

  1. ハイブリッド: 静香ベース構造を維持して、インテーク参照だけアンジュから弱く混ぜる((like ange katrina:0.5) 的にNL文に併記、ネガにアンジュアイデンティティ強めで剥がす)
  2. アンジュ+前髪上書き: アンジュ方向で (blunt bangs:1.3) + ネガに center parted bangs, parted bangs を強化して前髪の方向違い感を抑止
  3. 静香で妥協: 中型インテークを許容してLoRA訓練データに採用
  4. 正面構図プロンプト群を強化: 単一の front view ではなく、複数の正面強制タグ(symmetrical face / facing forward / centered composition / straight-on angle 等)を積んでAnimaの構図バイアスを物理的に上書きする

条件AF ハイブリッド試行(静香ベース + アンジュインテーク形状参照)

NL文を「Her front hair is styled like mogami shizuka from idolmaster million live with blunt bangs and half-up hair, while the intake locks at the temples are shaped like ange katrina from nijisanji with sharp forward-facing scoops.」と2キャラ参照に書き換え。ネガにアンジュ・静香両方のアイデンティティ要素を入れる。

AF-ハイブリッド1。3/4寄り、薄〜中型インテーク、紺ジャケット+白カラー+青リボン、ぱっつん寄りだが完璧ではない AF-ハイブリッド2。3/4寄り、青系制服、薄いインテーク、姫カット寄り前髪 AF-ハイブリッド3。3/4寄り、ぱっつん前髪寄り、紺ジャケット+白カラー+黒リボン、薄いインテーク AF-ハイブリッド4。3/4寄り、白カラー+青タイ、ぱっつん寄り前髪、薄いインテーク

予想していたほどの前髪の崩れは出ず、画像出力の品質は若干向上した印象。
ただしインテークサイズはAE比で目立った増加なし、前髪もAE/ADと同程度で姫カット寄りが混ざる。
さらによく見ると 前髪にクロスの跡が薄く残っている。これはアンジュ参照の中央分け前髪が「残滓」として残っている形で、like ange katrina をNL文に併記した分だけアンジュアイデンティティの一部がにじみ出てきた、と判断する。完全に前髪が崩れるほどには出ないが、痕跡として確認できる。
ハイブリッドは決め手にはならず、アンジュ・静香どちらかをベースに別軸で押す必要が残った。

条件AG 正面構図プロンプト群を強化する

正面の取り方をプロンプト側から強引に上書きする。単一の front view ではなく、対称性・視線・姿勢を別タグで明示 することでAnimaの判断を真正面に固定する。

ポジティブ構図部分に以下を積み増し。

front view, facing forward, looking straight ahead, symmetrical face, eye contact,
body facing forward, head facing forward, fully frontal pose,
centered composition, character in the middle, straight-on angle, upper body

ネガティブにも回避要素を強化。

side view, profile, from side, turned head, three quarters view, three-quarter view, looking up, looking away

ベースキャラはAEと同じ静香参照(like mogami shizuka from idolmaster million live + (hair intakes:2.0) + (blunt bangs:1.3))。

AG-正面強化1。真正面、ぱっつん前髪(束感は弱め)、左右対称ハーフブレイド+青リボン、両側インテーク、ただし衣装欠落で胸元露出 AG-正面強化2。真正面、ぱっつん前髪(束感薄め)、左右対称、白タートルネック、薄いインテーク AG-正面強化3。真正面、ぱっつん前髪(束感薄め)、左右対称、青ワンピース+白カラー+青リボン、両側インテーク AG-正面強化4。真正面、ぱっつん前髪(束感薄め)、左右対称、青ワンピース+白カラー+青リボン、両側インテーク

4枚中4枚で真正面+左右対称ハーフブレイド+青リボン+両側インテークが揃った
ここまでの3/4寄り問題が一気に解けた。LoRA訓練データの「真正面」角度として直接使える品質。
インテークサイズ自体は中型のままだが、構図・髪型細部はすべて目標に到達している。
前髪は分類としてはぱっつんだが、束感(毛束のテクスチャ)が薄くて「明確にぱっつん」と言い切れる強さには足りず、どちら付かずの境界に乗っている。
さらにウェイトを上げるとこの境界から 姫カット側にずれる 挙動になるので、ぱっつん側でもう一段くっきり出したいなら、束感を別軸で足す方向になる(thick bangs / locks of bangs 系のタグや、NL文で束ねた質感を描写する)。

この姫カット側へのずれは興味深くて、静香本人は姫カットをしていない。実際の静香はぱっつん寄りのストレート前髪+両側サイドロックで姫カット定義を満たさない。
それでも like mogami shizuka NL参照を強く押すと姫カット風の要素が表面化するということは、Anima内部の mogami shizuka 学習画像群の中に姫カット系の描かれ方をしたものが混ざっていて、それが「最後に残るアイデンティティ残骸」として残ってくる構造になっている、と判断する。
昨日のJ2で (hair intakes:2.0) にしたらNayuki本人寄りに変化したのと同型の現象で、こちらは正方向に欲しい特徴(インテーク)だったが、今回は意図しない方向(姫カット)に変化する。
ベースキャラと参照キャラの組み合わせで「強く押した時に何が表面化するか」は事前に予測しにくく、毎回実機で確認するしかない。

1枚目だけ衣装が欠落して胸元露出寄りに変化した。
ネガに nude, topless, bare shoulders, exposed breasts 等を追加すれば抑止できる範囲の事故。

正面の取り方は、Animaにとって「単一の front view タグ」より「対称性・視線・姿勢を別軸で明示する複数タグ」のほうが効果が出る、という発見。
昨日のMで front view, facing viewer だけでは斜めに変化していた現象が、複数タグ積み増しで4枚中4枚の真正面に変わった。

さらに重要なのは、真正面ビューでもハーフブレイドアップの三つ編みが画面に映る ことがAGで確認できた点。
昨日の記事で「Animaは正面ビューではハーフブレイドの三つ編みは見えないと思っている」という常識を立てて、それを回避するためにW(22.5度)やZ(from above)を採用していた。今回のAGで、その常識は タグ群を強化すれば突破できる と分かった。
Animaが「正面ビューでハーフブレイドを見せられない」のではなく、「単一の front view だけ指定すると斜めに変化してブレイドを背面に持っていく」癖を持っていただけで、対称性・視線・姿勢を別タグで縛れば正面+ハーフブレイドの編み込みが両立する。昨日の仮説の上限が思っていたより低く、プロンプト側で正面を強く縛れる余地が残っていた。

条件AH AGベース + 前髪・サイドロック調整 + 衣装欠落抑止

参考にしている目標イメージとAGの出力を比べて、まだ差が残る部分の調整。
目標は「ぱっつん前髪に明確な束感」+「両脇に胸位置まで伸びる独立した毛束(俗称『触覚』、Danbooruタグ的にはサイドロックの短〜中独立版に近い)」+「衣装は白シャツ系」。

AGからの変更点。

  • (hair intakes:2.0)(hair intakes:1.3)(スクープ化を抑えて、両脇毛束をサイドロック寄りに)
  • (sidelocks:1.4) を追加で両脇の独立毛束を強化
  • forelock をタグ列に追加
  • NL文に「thick blunt bangs with visible strand separation, short sidelocks framing the face on both sides with distinct strand separation」を足して束感と触覚を明示
  • 静香インテークの説明文を「pointing downward rather than scooping forward, blending with the sidelocks」に書き換えてスクープではなく下向き独立毛束に寄せる
  • ネガに nude, topless, bare shoulders, exposed breasts, no clothing を追加して衣装欠落シードを抑止
  • ポジに white shirt を追加

AH-調整1。真正面、ぱっつん寄り、左右対称、白Tシャツ、触覚は顎下まで、参考画像より短い AH-調整2。同様、白Tシャツ、触覚短め AH-調整3。同様、白Tシャツ襟あり、触覚短め AH-調整4。同様、ボタン付き白シャツ、触覚短め

4枚中4枚で真正面 + 左右対称 + 白Tシャツ系衣装が安定。衣装欠落シードは今回ゼロ(ネガ強化の効果)。
ただし 触覚(両脇の独立毛束)は伸びない。参考画像では胸位置まで伸びているが、AHでは顎下〜首あたりで止まる。
正面化したことで全体的に髪が短く描かれる傾向(3/4ビューなら触覚が顔の下まで伸びていた)も影響している。

Anima内部の認識は「静香を金髪にして三つ編みを足した派生」止まり

ここで仮説が立つ。
ベースキャラに like mogami shizuka のNL参照を入れている時点で、Animaは出力を「静香の派生」として処理していて、静香本人の特徴量(触覚の短さ、ぱっつん寄り前髪、ミリマス系衣装クラスタ)が支配的に残る 構造になっている。
ぱっつん前髪が完全に出ない・触覚が伸びない・衣装が白Tシャツ系(ミリマス制服を剥がした後の白系シンプル)になる、これら全部が静香側から持ち越されている要素。

つまり今のアプローチはAnima内部では「静香 - 黒髪 - ミリマス制服 + 金髪 + 三つ編み」というベクトル演算として処理されていて、純粋な「インテーク持ち汎用キャラ」になりきれていない。
触覚を伸ばすには、NL参照を触覚の長いキャラに変えるか、sidelocks を更に強いウェイトで押す必要がある。ただしウェイトを上げすぎると別の要素(姫カット化等)が表面化する上限がある(AEで確認済み)。

これはキャラ参照経由アプローチ全体の限界で、Animaに「静香じゃない別人」として認識させるには、LoRA学習データを実際に集めて学習させる段階に進む必要がある、と判断する。今回のAGまでで得たプロンプトを使って訓練データを集めて、LoRAに別キャラとして焼き付けてしまえば、Anima側の「静香派生」認識を上書きできる。

条件AI 静香NL参照を外して長サイドロックを直接NL文で記述

AHで残った「触覚が短い+静香依存」を解消するため、静香NL参照を完全に外して、NL文に「長サイドロックが胸位置まで伸びる」を直接書く。

NL文。

Her front hair has thick blunt bangs with clear strand separation.
Long sidelocks frame the face on both sides, reaching down to her chest,
with distinct strand definition like floating antenna locks.
The intake locks at the temples blend with these long sidelocks pointing downward.

(sidelocks:1.6) に強化、(hime cut:1.3) でネガ強化、short sidelocks short hair をネガ追加。

AI-1。真正面、ぱっつん前髪、触覚長、ハーフブレイド+青リボン、白オフショル、アホ毛が長く伸びる AI-2。真正面、ぱっつん、触覚長、白ボタンシャツ、アホ毛長 AI-3。真正面、ぱっつん、触覚長、白ボタンシャツ、アホ毛長 AI-4。真正面、ぱっつん、触覚長、白オフショル、アホ毛長

ぱっつん前髪と触覚の長さは目標に到達した。AH比で明確な進歩。
ただし新しい問題として アホ毛が4枚中4枚で異常に長く伸びる。頭頂部から2〜3本ピョコっと立ち上がる。
加えて見た目年齢がAH比で 大人寄りに変化した。静香依存を外したことでベース分布が「成人寄りのblonde long」クラスタに変化した可能性がある。
原因の有力候補はNL文中の「floating antenna locks」。アンテナ=アホ毛とAnimaに読まれてる可能性が高い。

条件AJ アホ毛抑制+ティーン化

AIから2点修正。

  • ポジに teenager, high school student 追加、NL冒頭を A teenage girl in her late teens に変更
  • ネガに (ahoge:1.3), antenna hair, hair antenna, sticking up hair, mature, adult, old 追加

AJ-1。真正面、ぱっつん、触覚長、青リボン付き白シャツ、頭頂部にまだアホ毛 AJ-2。真正面、ぱっつん、触覚長、青リボン付き白シャツ、頭頂部にアホ毛、ティーン感あり AJ-3。真正面、ぱっつん、触覚長、青リボン白シャツ、アホ毛 AJ-4。真正面、ぱっつん、触覚長、白オフショル、アホ毛

teenager 追加で見た目年齢はティーン側に下がった。AJ-2は参考画像にかなり近い構成(青リボン+白シャツ+ぱっつん+触覚長+ハーフブレイド+青リボン)。
ただしアホ毛は依然として4枚中4枚で残る。NL文の「floating antenna locks」が antenna hair ネガを上回って機能している可能性が高い。

条件AK アホ毛完全除去で目標に近づく

AJ-2の構成から「アホ毛だけ取れば目標」と判断、NL文の問題箇所とネガを修正。

  • NL文から「like floating antenna locks」を削除、「hanging straight beside the face with clear strand separation」に書き換え
  • ネガを (ahoge:1.5), antenna hair, antenna locks, hair antenna, sticking up hair, cowlick, stray hair, single strand sticking up まで強化
  • ネガに crossed bangs も追加(前髪のクロス跡抑止)

AK-1。真正面、ぱっつん、触覚長、白カラー付きシャツ、ハーフブレイド+青リボン、アホ毛なし、参考画像に到達 AK-2。真正面、ぱっつん、触覚長、白オフショル、頭頂部に短いアホ毛が薄く残存 AK-3。真正面、ぱっつん、触覚長、白半袖シャツ、ハーフブレイド+青リボン、アホ毛なし、参考画像にかなり近い AK-4。真正面、ぱっつん、触覚長、白半袖シャツ、わずかにアホ毛残り

3/4でアホ毛抑制成功、1/4で頭頂部に短いアホ毛がわずかに残る。
AK-1とAK-3は参考画像と並べて見ても近い位置 に到達。

  • ✅ 真正面
  • ✅ ぱっつん前髪(束感もある程度)
  • ✅ 触覚(長サイドロック)が胸位置まで伸びる
  • ✅ ハーフブレイド+青リボン
  • ✅ 白シャツ系衣装(参考画像のシャツに近い)
  • ✅ 金髪
  • ✅ アホ毛なし(3/4で)
  • △ 見た目年齢がまだ少し上気味
  • △ 前髪に1本クロスがシードによって混ざる

残課題は「もう少し年齢下げ」と「クロス前髪のさらなる抑止」の2点で、これはALの微調整で詰める。

条件AL 年齢下げ + 前髪クロス抑止強化

ポジに (safe:1.3) でsafeを強化(AnimaではNSFWネガより safe ポジが効果を出すという確認結果)、young face を足して年代記述を補強。ネガに (crossed bangs:1.4), (center parted bangs:1.2), (mature:1.3), (adult:1.3), (old:1.2), milf をウェイト付きで追加。

AL-1。真正面、青リボン+白カラー、ティーン寄り、インテークはサイドロックに統合され弱まる AL-2。真正面、青リボン、ティーン顔、インテーク弱 AL-3。真正面、青リボン、ティーン顔、インテーク弱 AL-4。真正面、青リボン、ティーン顔、インテーク弱

ティーン感は下がったが、インテークが凹んでサイドロックに吸収された(sidelocks:1.6) 強化と (hair intakes:1.3) のバランスで、サイドロックがインテーク領域を取ってしまった形。「もみあげの長い金髪の女」になってしまい、本来欲しいインテークが消えた。

インテークと長サイドロックは別軸要素のはずだが、Anima内部のサイドロッククラスタがインテークを取り込んでしまっている、と判断する。

条件AM インテークとサイドロックを別軸で分離指示

NL文を書き換えてインテークがサイドロックと独立した存在として描かれるよう明示。

The intake locks at the temples are separate from the long sidelocks,
forming clear forward-pointing scoops above the sidelocks at each temple.

ウェイトも (hair intakes:1.6) に戻す。

AM-1。真正面、青大ボウタイ+白カラー、ティーン顔、インテークは弱まま AM-2。真正面、青リボン+白ボタンシャツ、ティーン顔、インテーク弱 AM-3。真正面、青大ボウタイ、ティーン顔、インテーク弱 AM-4。真正面、青大ボウタイ、ティーン顔、インテーク弱

ぱっつん前髪 + 長サイドロック + ハーフブレイド + ティーン顔 + 青リボン衣装の安定感は出てきたが、インテークは依然サイドロックに吸収されて立ち上がらない。NLの分離指示だけでは効果が弱い。

条件AN インテーク強化 + サイドロック下げ + NL順序入れ替え

インテークのウェイトを (hair intakes:1.8) に上げ、サイドロックを (sidelocks:1.4) に下げてインテーク優先化。NL文もインテーク記述をサイドロックより前に置き直す。

AN-1。真正面、青リボン、ぱっつん前髪、サイドロック長、インテークはまだ弱め AN-2。真正面、青リボン、ティーン顔、インテーク弱め AN-3。真正面、青リボン、ティーン顔、インテーク弱め AN-4。真正面、青リボン、ティーン顔、インテーク弱め

「現代風と言えばそうだが今の指定ではない」という出力。インテークは出ているが小さく、スクープ型ではない。アイドル系の控えめなインテークに収束している。 目標は「明確な前向きスクープ」型なので、別キャラ参照を混ぜてスクープ要素を強化する方向に切り替える。

条件AO 静香 + 千反田えるのハイブリッド

千反田えるは京アニ「氷菓」のヒロインで、黒髪ロング+ぱっつん前髪+顔の横を流れる長いサイドの髪が特徴の女子高生。インテークそのものは持っていないが、サイドの毛束が胸位置まで伸びる構造が今欲しい「長い触覚」に近い。

発想の起点。えるは「ぱっつん前髪 + サイドが長い(ただしインテーク起点ではなく前髪と独立)」、静香は「インテーク起点だがちょっと短い」。両者を合体すると「インテーク起点 + 長く伸びる」のちょうど良い触覚になるはず、というユーザー仮説。

NL文に2キャラ参照を併記。

Her front bangs and side hair are styled like chitanda eru from hyouka,
with thick blunt bangs and long sidelocks reaching down to her chest.
The intake locks at the temples are styled like mogami shizuka from idolmaster million live,
originating between the bangs and sidelocks and extending downward together with the sidelocks.

ネガに chitanda eru, mogami shizuka, sailor uniform, sailor collar, idolmaster uniform を追加。

AO-1。ぱっつん明確、サイドロック長、白カラー+青リボン、髪色がやや赤茶寄り、インテーク弱 AO-2。同様、ハーフアップ青リボン、白Tシャツ、インテーク弱 AO-3。同様、ハーフアップ青リボン、白半袖シャツ、インテーク弱 AO-4。同様、白カラー+青リボンシャツ、インテーク弱

ぱっつん前髪+サイドロック長は達成、ただし えるの前髪→サイドロック一体構造が支配的でインテーク起点の分離感が弱まる。えるの構造が「前髪から直接下に流れる」ので、静香の「インテーク起点で伸びる」が薄れた。

条件AP 名雪 + 千反田えるのハイブリッド

静香じゃなくて名雪をインテーク参照に。名雪はインテーク強型なので、えるの長サイドロックと組み合わせれば「インテークから長く伸びる」が出るかも。

AP-1。京アニ風の絵柄、ぱっつん+長サイドロック+両側青リボン、インテークは控えめ AP-2。同様、京アニ風絵柄、青リボン白カラー、インテーク控えめ AP-3。同様、京アニ風絵柄、白半袖シャツ、インテーク控えめ AP-4。同様、青リボン、インテーク控えめ

AOよりは指定に近いが、えるNL参照が絵柄全体を京アニ調に寄せる。「える感」が強すぎる。えるの影響力は予想以上に強い。

なお1/4でクロス前髪が消えていて、3/4はクロスが残る、という変化はあった。

条件AQ 静香 + 名雪のハイブリッド(える排除)

えるの京アニ感を排除して、静香ベース(前髪・ハーフアップ)+ 名雪(インテークスクープ強)の二段重ねに。

AQ-1。静香寄り、ぱっつん前髪短め、姫カット風になっている、白ボタンシャツ AQ-2。同様、姫カット寄り、白ボタンシャツ AQ-3。同様、姫カット寄り、白半袖シャツ AQ-4。同様、姫カット寄り、白Tシャツ

今度は静香が強く出すぎて 姫カット風に変化した。静香NL参照を強く押すとAEで確認した「静香の姫カット残骸」が表面化する現象が再発した。触覚も短く、静香の特徴に引っ張られた。

条件AR 名雪単独参照 + 長サイドロックをウェイトで表現

ここで方向転換。えるも静香も外して、NL参照は名雪のみに絞る。長サイドロックは (long sidelocks:1.5) のウェイトとNL文での記述だけで表現。

NL文。

The intake locks at the temples form prominent forward-pointing scoops
like minase nayuki from kanon (game),
extending downward into long sidelocks reaching her chest, hanging straight beside the face.

AR-1。真正面、ぱっつん前髪、左右対称ハーフアップ青リボン、白ボタンシャツ+タートルネック、サイド長め、インテーク中型でうっすら立ち上がり、参考画像にかなり近い AR-2。同様、白ボタンシャツ、ティーン顔、参考画像に近い AR-3。同様、白半袖Tシャツ、ティーン顔、近い位置 AR-4。同様、白ボタンシャツ、ティーン顔、近い位置

ここでバランスが取れた。4枚中4枚で次の要素が揃った。

  • ✅ 真正面構図
  • ✅ ぱっつん前髪
  • ✅ 触覚(長サイドロック)が肩〜胸位置
  • ✅ ハーフブレイド+青リボン両側
  • ✅ 白シャツ系衣装(参考画像に近い)
  • ✅ 金髪
  • ✅ ティーン顔
  • ◯ 中型インテークでサイドロック上に立ち上がり

ハイブリッドで色々混ぜていた割に、結局 名雪単独参照に絞ったほうが綺麗にまとまった。える・静香NL参照を併用するとそれぞれのキャラアイデンティティがにじみ出て参照キャラの絵柄に持ち込まれる、一方で名雪単独だと「Kanon集団の事前分布」のインテーク特徴だけ普通に乗ってくる。

ただしクロス前髪は4枚中3/4で依然として残っている。

条件AS クロス前髪の原因絞り込み(hair between eyesをネガ追加)

クロス前髪の原因を絞り込む。crossed bangs ネガが効果を出さないので、Danbooruの標準タグである hair between eyes(前髪中央の1本毛束)の方が本来の名前ではないかと仮説。(hair between eyes:1.4) で強くネガに入れる。前髪ウェイトも (blunt bangs:1.1) に下げる。

AS-1。クロス前髪あり AS-2。クロス前髪あり AS-3。クロス前髪薄め AS-4。クロス前髪あり

ASでも3/4でクロス前髪が残った。hair between eyes ネガ + (blunt bangs:1.1) 緩和の組み合わせでも原因に到達せず。

条件AT forelockタグ削除 + インテーク1.5 + NL簡略化

別の容疑者として forelock タグ。これが前向き毛束を呼んでいる可能性。タグから forelock を削除、NL文を最小限に簡略化、インテークウェイトを1.5に下げる。

AT-1。クロスなし、ぱっつん前髪、ハーフアップ+青リボン、白タートルネック+ボタンシャツ、ティーン顔 AT-2。クロスあり AT-3。クロス薄め AT-4。クロス薄め

AR/ASの3/4クロスからATは 2/4クロス に改善。forelock 削除 + インテーク下げの組み合わせは小さくクロスを抑える効果はある。ただし完全には消えない。

条件AU 前髪ストレートNL補強 + 照明変更

クロスがまだ残るので、別方向から。前髪のストレート性をNLで明示し、さらに「全体に均一な照明」を指定して凹凸を減らす。ユーザーから「これ毛なのか光の筋なのか微妙」という指摘があり、照明調整で消える可能性も視野に入れる。

ポジに soft lighting, studio lighting, even lighting, front lighting 追加、ネガに harsh shadows, dramatic lighting, side lighting, strong shadows on bangs 追加。 NL文に「Her bangs are completely straight, flowing parallel down from the hairline like neatly cut blunt bangs, with no hair strands crossing or overlapping each other across the forehead.」追加。

AU-1。クロスあり、ぱっつん明確、サイド長、ハーフブレイド+青リボン、白オフショル、ティーン顔 AU-2。クロスあり、白ボタンシャツ、ティーン顔、近い位置 AU-3。クロス薄め、ぱっつん明確、ハーフブレイド+青リボン、白オフショル、ティーン顔、かなり近い AU-4。クロスあり

AUはATより悪化(3/4クロス)。照明変更+ストレートNL補強は決め手ではなかった。

ここまでで確認できたのは、クロス前髪1本がプロンプト調整では完全には消せない こと。原因として以下が考えられるが、特定できていない。

  • Animaベース分布の「金髪 + ぱっつん前髪 + インテーク + ハーフアップ」クラスタに共起する装飾的副産物
  • 学習データに「分け目から流れる1本」を持つ画像が高密度に混ざっている
  • ハイライト/光の筋として描画されるシードも混在

インペイントで前髪領域だけ後処理する経路があるが、ローカル環境(M1 Max)ではLoRA訓練データ規模の枚数を回すのに重い。
現実的には 生成時にクロスなしシードを目視で除外して採用 する運用、つまり4枚回して1〜2枚採用する歩留まりで訓練データを集める方向に切り替える。

条件AV〜AX 顔の影を落とすための照明指示の試行錯誤

ARで構図と特徴は取れたが、顔の頬・あご・首元に陰影が落ちていて、LoRA訓練素材としては「キャラ特徴」より「逆光バイアス」を先に学習しそうな状態。これを抑えるために照明指示を入れる方向に切り替えた。

AV では front lit, key light from front, no backlight をポジに、backlit, rim lighting をネガに追加。

AV-1。顔に影、胸元だけ明るい AV-2。顔に影、胸元だけ明るい AV-3。顔に影、胸元だけ明るい AV-4。顔に影、胸元だけ明るい

AW で ambient light, soft diffuse light, soft front lighting を追加。

AW-1。顔に影、頭頂と胸が明るい AW-2。顔に影、頭頂と胸が明るい AW-3。顔に影、頭頂と胸が明るい AW-4。顔に影、頭頂と胸が明るい

AX で high-key lighting をポジに足した。

AX-1。顔に影、胸元だけ明るい AX-2。顔に影、胸元だけ明るい AX-3。顔に影、胸元だけ明るい AX-4。顔に影、胸元だけ明るい

AV/AW/AXいずれも 顔の頬・あごに影が残ったまま、胸元や頭頂部だけが明るくなるfront lit high-key を入れても光源は逆光気味のままになる。Illustrious系の学習データバイアスで「美少女顔=逆光・斜光」が選ばれている可能性が高い。

条件AY 照明指示を全削除して背景白だけ指定

仮説転換。照明指示自体が逆効果なのではないか。光源指定タグを全部抜いて (white background:1.4), simple background だけにする。ネガから照明関連も削除。

AY-1。顔の影 AV/AW より軽減、ただし依然うっすら影 AY-2。前髪クロスなし、顔の影最小、頭頂部がフレーム上端ギリギリ AY-3。顔うっすら影、頭頂部上端ギリギリ AY-4。顔うっすら影、頭頂部上端ギリギリ

AY-02で前髪クロスも消えて顔の影がAY系で一番軽くなる枚が出た。照明指示を全削除した方が、入れるより顔の影が軽くなる と判明。

ただし2点の課題が残った。

  • 頭頂部が画像上端ギリギリで、髪の毛先がフレーム外に出ている
  • 顔のうっすらした影は依然残る(Anima/Illustrious系のベースモデル自体が陰影を入れる塗り傾向を持っている)

条件AZ 頭頂部の余白を確保 + 顔正面光のNL記述

構図に (full head visible:1.3), (headroom above head:1.3), head and shoulders shot, space above hair を追加。顔の影を抑えるため flat shading, anime cel shading, soft diffuse light, (even lighting on face:1.3), (no shadows on face:1.3) をポジに、(shadows on face:1.4), (face shadow:1.4), (cheek shadow:1.3) 等をネガに足した。

AZ-1。頭頂部余白できた、顔に依然影 AZ-2。頭頂部余白できた、顔に依然影 AZ-3。頭頂部余白できた、顔に依然影

構図の余白は出たが顔の影は思ったほど抜けず。ここで別のAI(Codex)にプロンプトを見せたら指摘が効いた。

  • flat shadinganime cel shading が矛盾している(前者=陰影なし、後者=2〜3階調の明確な影)。SDXL系は矛盾プロンプトを受けると「とりあえず影を入れる」方向に変化しがち
  • upper body + head and shoulders shot + head to chest framing のフレーミング系トークン三重指定で、カメラが引き気味+逆光気味の構図になる
  • (safe:1.3) はIllustrious系だと光源にも影響して「神聖な逆光」を選びやすい。1.0 か削除で十分
  • そもそも masterpiece, best quality, score_7 系の品質タグがIllustriousだと光源演出を派手にする。LoRA訓練素材を作るなら品質タグは抜くか弱める方向

条件BA 品質タグ削除 + 演出系全削除 + 影殺し全力ネガ

Codexの指摘を全部反映する方針に転換。ポジから masterpiece, best quality, score_7, (safe:1.3)、矛盾していた flat shading、三重指定の head and shoulders shot, head to chest framing を全削除。代わりに flat color, no shadows, even lighting, ambient lighting, plain lighting, studio lighting, official art style, clean lineart で塗り側をフラットに寄せる。ネガには shadows, cast shadow, harsh shadow, dark face, backlight, rim light, contre-jour, dramatic lighting, chiaroscuro, strong contrast, vignette, bloom, lens flare, depth of field を追加。

BA-1。顔の影大幅軽減、襟もとに青リボン BA-2。顔の影軽減、襟もとに青リボン+グレーベスト BA-3。顔の影軽減、襟もとに青リボン+黒ストラップ BA-4。顔の影軽減、襟もとに青リボン、頭頂部余白あり、最終採用

BA-04が今回の最終形。AY/AZより顔の頬・あごの影が明確に薄くなり、フラット寄りの塗りになった。真正面、頭頂部から胸までフレーム内、上に余白あり、前髪クロスなし、両側青リボン、ぱっつん前髪、長サイドロック、ティーン顔と全要素が揃った。

副産物として、BA4枚は襟もとに青リボン/青リボンが出る傾向になった。blue ribbon トークンが髪じゃなく襟側に行く側面はあるが、LoRA訓練素材としては服のバリエーションが乗っているだけで悪さではない。

LoRA訓練素材として採用するBA構成

LoRA訓練素材として採用するのは BA構成

要素内容
NL参照like minase nayuki from kanon (game) ベースだったが、BAではNLも削ってDanbooruタグ列だけで構成(インテークは (hair intakes:1.5) のウェイトで呼ぶ)
品質タグなしmasterpiece, best quality, score_7 系を全削除(Illustrious系で光源演出を派手にする副作用を抑える)
safeタグなし(safe:1.3) を削除(「神聖な逆光」を呼ぶ副作用を抑える)
構図upper body, front view, looking at viewer だけ。フレーミング系トークンの三重指定はしない
塗りflat color, no shadows, even lighting, ambient lighting, plain lighting, studio lighting, official art style, clean lineart
背景simple background, white background
キャラ特徴blonde hair, long hair, blue eyes, blunt bangs, (hair intakes:1.5), long sidelocks, half updo, braid, blue ribbon, white shirt
ネガ強化shadows, cast shadow, harsh shadow, dark face, backlight, rim light, contre-jour, dramatic lighting, chiaroscuro, strong contrast, vignette, bloom, lens flare, depth of field で陰影演出を全力で消す

途中までAR(名雪単独参照 + 正面強制タグ群)を最良案にしていたが、顔に影が落ちてLoRA素材としては陰影バイアスを学習しそうな問題がAV/AW/AXで見えた。AYで「照明指示を抜くほうがフラットに寄る」を確認、Codexの指摘で「品質タグそのものが演出を強める」と判明、BAで品質タグ削除+影殺しネガを入れて顔の影が大きく軽減した。

ハイブリッド経路(静香+える、名雪+える、静香+名雪)は途中試したが、えるはAnima側の絵柄全体を京アニ調にし、静香は姫カット残骸を表面化させる傾向があって、結局NL参照は1キャラに絞るか、いっそNLを抜いてDanbooruタグだけで構成するほうが安定するという結果になった。

残るクロス前髪問題

AR/AS/AT/AU/BAを通して、額に1本斜めに走る「クロス前髪」毛束がプロンプト調整では完全には消えない。原因は特定できていない。

  • Animaベース分布の「金髪+ぱっつん前髪+インテーク+ハーフアップ」クラスタに共起する装飾的副産物
  • 学習データに「分け目から流れる1本」を持つ画像が高密度に混ざっている
  • ハイライト(光の筋)として描画されるシードも混在

ネガに crossed bangs, hair between eyes, stray hairs, parted bangs, asymmetrical bangs などをウェイト付きで足しても4枚中2〜3枚にクロスが残る。生成時にクロスなしシードを目視で除外して採用する運用、4枚回して1〜2枚採用の歩留まりで訓練素材を集める方向に切り替える。LoRA学習段階でクロスなしシードだけ学習に使えば、LoRA側で「クロスなし」が焼き付くので、訓練後はクロス問題そのものが解消する見込み。

参考