技術 約12分で読めます

同じキャラLoRAをAnima派生6種に当てて出力比較、トリガー一発ではどれも安定せず、RDBTは獣耳・軍装に暴走

いけさん目次

Anima派生チェックポイントを20本超分類した記事で「派生はぜんぶ同じベースを共有するのでAnima向けLoRA1つが全派生に載る」と書いた。その検証。WAI-Anima向けに焼いた自作キャラLoRAを、複数のAnima派生に同じプロンプト・同じシードで通して出力差を見る。M1 Max 64GBのComfyUI、Turbo LoRA併用。

派生は WAI-Anima(学習元)/ AnimaYume / RDBT / Kirazuri / Hikari / AnimaIkaの6本。JANIMAは記事執筆時点でアーリーアクセス(DLが有料)で、約10日後にフリー公開される予定だったので今回は外した。

先に検証結果概要。

  • 同じLoRAでも派生で出方は大きく割れる。差が一番出るのは衣装も何も指定しない「トリガー一発」
  • トリガー一語だけだとどのモデルもキャラが安定しない。サイドポニーまで含めたフルのかなちゃんが出たのは AnimaYumeの3枚中1枚だけ(s200、向かって右で学習素材通り)。WAI-Animaは3枚ともポニーが出ず、RDBTは獣耳・軍装に化ける
  • WAI-Animaは毎回ぶれずに茶髪+アホゲを出す安定型。ただし色が濃いめで暗く沈む、衣装も地味な私服に寄る
  • AnimaYumeは当たると色があっさり明るく絵も整うが、当たりは3枚中1枚で安定しない
  • RDBTは色が一番くすむ。トリガーだけだと獣耳・軍装に暴走する
  • 衣装を明示する重い指定にすると各モデルとも制服のかなちゃんに揃う。ただし制服程度の単純な服なので大した比較にはならない
  • けいちゃんはトリガー一語ではほぼ出ない(造形を保てたのはHikariだけ)。ただし構造タグ+制服を足せば6モデルとも制服のけいちゃんに収束する

当てたLoRAと派生

LoRA2個はどちらもWAI-Animaの上で学習した自作キャラ。素材の出自が対照的なのが今回の見どころになる。

キャラLoRA学習素材の出自識別キー
かなちゃんkanachan-waianima-rework-v4 ep180Geminiで出した画像(Anima系の外)サイドポニー+アホゲ+青シュシュ
けいちゃんkeichan-waianima-v1 ep20WAI-Animaで出した画像(Anima系の中)エアインテーク+ハーフブレイド+青リボン

かなちゃんはGeminiで生成した素材をAnimaに学習させたLoRAで、Anima系とは別分布の絵から焼いている。けいちゃんはWAI-Animaの出力だけで学習したLoRAで、ベースと同じ分布から焼いている。

ラベルチェックポイント系統性格
WAI-AnimawaiANIMA_v10WAIライン(基準)両LoRAの学習元。画風チューニング済み
AnimaYumeanimayume_v05王道ファインチューンDL最多級、NSFW対応
RDBTrdbtAnima_b1V0371蒸留ガイダンス蒸留でCFG1〜4動作。画風指定が必須
KirazurikirazuriAnima_v20大規模ファインチューンpreview3-baseを35,537枚で学習。独自画風が強い
HikarihikariAnima_100逆張り品質タグ依存を排除、フィルムグレイン
AnimaIkaanimaika_v40マージWAI-Animaを材料に含むマージ

生成条件

各モデルとも同じ設定で揃える。テキストエンコーダ(qwen_3_06b_base)とVAE(qwen_image_vae)は派生共通なので固定。

項目
解像度832×1216
ステップ8
CFG1.0
サンプラーer_sde / simple
Turbo LoRAanima-turbo-lora-v0.1 strength 1.0
シード42 / 100 / 200(固定)
かなLoRA strengthmodel 1.0 / clip 0.8
けいLoRA strengthmodel 1.0 / clip 1.0
生成時間約40秒/枚(M1 Max 64GB)

素の出力(LoRAなし)でモデルの画風を見る

キャラLoRAを当てる前に、6モデルが汎用プロンプトで何を出すかを見る。過去記事と同じ「金髪+白いローブ+金刺繍」の棒立ちプロンプト、LoRAなし、Turboのみ。シード42。

WAI-Anima
素 WAI-Anima
AnimaYume
素 AnimaYume
RDBT
素 RDBT
Kirazuri
素 Kirazuri
Hikari
素 Hikari
AnimaIka
素 AnimaIka

同じプロンプトでも画風と色味がかなり違う。WAI-AnimaとAnimaIkaはほぼ同じ系統で見分けがつきにくい(AnimaIkaがWAI-Animaを材料に含むマージなので筋は通る)。Hikariはガチの萌え寄り2Dで、6モデルで一番アニメ然としている。AnimaYumeは最近のアニメっぽい塗りで、柔らかく淡め。RDBTはリアル寄りでアニメから外れ、ゴシックな洋ゲーの立ち絵のような質感、色もくすむ。Kirazuriはリアル寄りの2Dで、プロンプトにないランタンなどの小物まで足してくる独自画風の強さが出る。AnimaIkaにはウォーターマーク(学習データ由来と思われる)が乗ることもある。この画風差が、キャラLoRAを当てたときの色味や暴走の方向を左右する。

ここからLoRAを当てる。プロンプトは軽い指定(トリガー一語のみ)と重い指定(衣装・髪型・色を盛る)の2段階。

# 軽い指定(トリガーのみ)
{trigger}, 1girl, solo, standing, looking at viewer, full body, white background

# 重い指定(かな)
masterpiece, best quality, score_7, safe, 1girl, solo, kanachan,
side ponytail, ahoge, double parted bangs, medium hair, blue scrunchie,
white collared shirt, red necktie, looking at viewer, front view,
white background, simple background, full body, standing

かなちゃんをトリガー一発でどこまで出せるか

ここが一番差が出る。衣装も髪型も指定せず kanachan 一語だけ与えて、各モデルが何を出すか。かなちゃんの識別キーはサイドポニー(学習素材では向かって右)+アホゲ+青シュシュ。

WAI-Anima(ぶれないが平坦)

シード42
かな WAI-Anima シード42
シード100
かな WAI-Anima シード100
シード200
かな WAI-Anima シード200

3シードとも茶髪+アホゲは安定して出るが、サイドポニーは1枚も出ない。衣装はセーター・エプロン・カーデと毎回地味な私服。学習元だけあって顔と要素はぶれないが、出てくる絵は平坦で、色も少し暗く沈む。

AnimaYume(3枚中1枚だけフルで出た)

シード42
かな AnimaYume シード42
シード100
かな AnimaYume シード100
シード200
かな AnimaYume シード200

s42は着物、s100はTシャツと振れて、サイドポニー+アホゲ+制服のフルのかなちゃんが出たのはs200の1枚だけ(向かって右、学習素材通り)。3枚中1枚なので安定はしないが、トリガーだけでポニーまで拾えたのは全モデル通してこの1枚だけ。当たった1枚は色があっさり明るく線もくっきりで完成度は高い。

RDBT(獣耳・軍装に化ける)

シード42
かな RDBT シード42
シード100
かな RDBT シード100
シード200
かな RDBT シード200

3シードとも獣耳+尻尾+ボロ軍装に化けて、かなちゃんとして認識できない。RDBTのCivitAIページには「画風指定が必須で、無指定だと画風がランダムになる」と書いてある。トリガーしか与えていないこの条件はまさにその無指定で、RDBTが持つサバイバル寄りの既定の絵柄にキャラが飲まれる。ちなみにかなちゃんの学習素材には、獣耳も尻尾もRPG風の衣装も一切ない。

Kirazuri

シード42
かな Kirazuri シード42
シード100
かな Kirazuri シード100
シード200
かな Kirazuri シード200

サイドポニーらしきものは1枚目(s42)にうっすら出るが、ポニーというよりサイドで小さく結んだ束に近く、しかも向かって左なので学習素材と向きが合わない。髪色も学習素材の茶髪とは別物で、アホゲは2枚で出るものの学習素材よりはるかに小さい。しかもs100・s200の2枚が猫耳+尻尾の獣娘に振れ、色味もくすんで暗い。3枚中2枚が別物という点でRDBTに近く、そのままだとかなちゃんを出すのは厳しい。描画もややオーバー気味な印象で、指定をそれなりに入れても頼んでいないポーズを勝手に出してくることがある。数枚での印象なので断定はできないが、Kirazuri独自の癖に見える。

Hikari

シード42
かな Hikari シード42
シード100
かな Hikari シード100
シード200
かな Hikari シード200

茶髪+アホゲ+私服でサイドポニーは出ない。獣娘のような暴走はないが、顔の造形が他モデルより丸めに変わる。フィルムグレイン狙いの通り全体に少しくすんで柔らかい。

AnimaIka

シード42
かな AnimaIka シード42
シード100
かな AnimaIka シード100
シード200
かな AnimaIka シード200

茶髪+アホゲ+私服で、6モデルで一番WAI-Animaに近い出方。マージ材料にWAI-Anima v1を含むのだから順当。サイドポニーは出ず、s200では猫耳+尻尾に振れる(同じく材料のCat Tower由来か)。

ここまで6モデルを並べると、トリガー一発でサイドポニーまで出たのは結局AnimaYumeのs200だけ。残りはWAI-Anima型の「茶髪+アホゲ+私服、ポニー無し」か、RDBT・Kirazuri・AnimaIkaのように獣耳へ振れるかのどちらかで、誰も安定してかなちゃんを出せていない。

衣装を明示すると揃う(が、色味の差は残る)

トリガーに加えて制服・髪型・色を盛った重い指定にすると、各モデルとも制服姿のかなちゃんに収束する。獣耳に化けていたRDBTもちゃんと戻る。

WAI-Anima
かな WAI-Anima 重い指定
AnimaYume
かな AnimaYume 重い指定
RDBT
かな RDBT 重い指定
Kirazuri
かな Kirazuri 重い指定
Hikari
かな Hikari 重い指定
AnimaIka
かな AnimaIka 重い指定

獣娘に振れていたKirazuri・AnimaIkaも、衣装を明示すれば制服のかなちゃんに戻る。

出している服は白シャツ+赤ネクタイ+スカートの単純な制服で、これくらいなら指定すればどのモデルでも出る。ただしサイドポニーの向きは安定しない。この6枚でもHikariとKirazuriは向かって左に出ていて、学習素材通りの向かって右にならない。向きがシードでブレるのは過去のWAI-Anima検証でも出ていた挙動で、重い指定でも一発で正しい向きには揃わない。HikariとKirazuriはこの2モデルだけ顔の造形も他の4モデルと少し違って見えるので、何か別系統なのかもしれないが原因は分からない。

収束自体は当たり前なので、ここで差が出るのはむしろ色味の方。同じシード・同じ制服で見ると、WAI-Animaは青や陰影が濃いめで全体に少し暗く沈み、AnimaYumeは塗りがあっさりして明るい。RDBTは3枚で一番くすんで色が沈む。AnimaYumeが「綺麗に見える」のはこのあっさりした明るさが大きい。

ここからは推測。かなちゃんのLoRAはGeminiで生成した画像から学習しているが、その素材は意図的に既存のアニメ塗りから外した、やや水彩寄りの色味で作ってある(Geminiの既定の画風がどうという話ではなく、学習素材をそっちに寄せたということ)。この素材の色がAnimaの得意なアニメ塗りとずれているぶん、WAI-Animaはその色を拾おうとして暗く沈み、AnimaYumeはAnima側のアニメ画風に寄せ直すので明るくあっさりする、という見立て。LoRA学習の時点でAnimaの画風がどれだけ焼き付いているかは分からないので確証はないが、出てきた絵の傾向はこの仮説と合う。

けいちゃん(構造タグ+制服を足せば6モデルとも出る)

けいちゃんの識別キーはエアインテーク(前髪両脇の前方向きスクープ)+ぱっつん前髪+ハーフブレイド+青リボン。

トリガー一語で造形が残るのはHikariだけ

keichan 一語だけだと、けいちゃんと分かる絵が出るのは6モデル中Hikariだけ。しかもHikariはトリガー一発でぱっつん前髪やブレイドまで含めてほぼ造形を保っていて、ここは正直意外だった。残り5モデルは金髪・顔の段階から崩れ、トリガー単体ではけいちゃんになっていない。けいちゃんのLoRA学習記事2体を1枚に合成した記事では、トリガーで髪色・顔・体型までは焼けるが髪型構造までは焼けないと書いたが、派生に載せ替えるとその前提も崩れて、Hikari以外は髪色・顔すら安定しない。

WAI-Anima
けい WAI-Anima トリガーのみ
AnimaYume
けい AnimaYume トリガーのみ
RDBT
けい RDBT トリガーのみ
Kirazuri
けい Kirazuri トリガーのみ
Hikari
けい Hikari トリガーのみ
AnimaIka
けい AnimaIka トリガーのみ

Hikari以外の5モデルは、トリガーだけだとベース既定の髪型に流れてエアインテークが出ない。識別キーをトリガーに任せきれない以上、これらでは別途タグで明示する必要がある。かなちゃんがトリガーだけでもアホゲ+茶髪までは拾えたのと比べると、自家生成素材で軽く(ep20)焼いたけいちゃんは髪型がトリガーに乗りきっておらず、丸ごと拾えるHikariはむしろ例外。

構造タグ+制服を足すと6モデルとも出る

過去記事で確立した構造タグ(blonde hair, long hair, blunt bangs, long sidelocks, half updo, braid, blue ribbon + インテークを描く自然文)に制服(白シャツ+赤リボンタイ+濃紺スカート+白ハイソックス)を足すと、6モデルとも金髪+ぱっつん前髪+青リボン+制服のけいちゃんに収束する。

WAI-Anima
けい WAI-Anima 構造タグ+制服
AnimaYume
けい AnimaYume 構造タグ+制服
RDBT
けい RDBT 構造タグ+制服
Kirazuri
けい Kirazuri 構造タグ+制服
Hikari
けい Hikari 構造タグ+制服
AnimaIka
けい AnimaIka 構造タグ+制服

学習元のWAI-Animaはもちろん、AnimaYume・RDBT・Kirazuri・Hikari・AnimaIkaのどれでもけいちゃんとして出る。制服を明示するとRDBTも兵装に化けず普通に出る。モデル間の差は素の画風(Kirazuriは髪がウェーブ気味で線が柔らかい、Hikariは萌え寄り、など)に乗る程度で、キャラの再現自体はどのモデルでも成立する。エアインテークの強さはモデルで多少ばらつくが、ぱっつん前髪+長い側毛+青リボンのハーフアップというけいちゃんの骨格はどのモデルでも保たれる。

かなちゃんのサイドポニーが重い指定でも向きがブレたのに対し、けいちゃんは左右対称の髪型なので向きの問題が起きず、制服まで指定すれば素直に揃う。ただしエアインテークの大きさはKirazuriを除くと総じて控えめで、これがブレの範囲なのかは枚数を出さないと判断できない。ただ元の学習記事でもインテークが大きく見える斜めアングルの素材はそこまで入れていないので、これくらいの出方は順当なところだろう。

どれが一番素直にLoRAのキャラを出すか

最初は学習元のWAI-Animaが一番素直だと思っていたが、見直すと「素直」の意味が分かれる。

  • 安定・予測可能(毎回同じ顔と要素を出す)なら WAI-Anima。学習元なのでぶれない。ただし色が暗く絵は平坦
  • 当たりが一番濃く綺麗なのは AnimaYume。サイドポニーまで拾った1枚があり、色もあっさり明るい。ただし3枚中1枚で安定はしない
  • RDBTは画風指定が前提のモデルで、トリガーだけだと自分の既定の絵柄にキャラを持っていく。色も一番くすむ
  • トリガー一発で造形まで保てた唯一のモデルが、意外にもHikari。全体に元キャラより淡く丸い絵になるので完全再現はできないが、焼きつきの甘いけいちゃんですらトリガー一発で出せた。出来がいまひとつのLoRAを一発で出したいときには向くかもしれない。Anima外のGemini素材で焼いたかなちゃんでも同じように出るので、学習素材がAnima分布かどうかで出やすさが決まっているわけではなさそう(ただしかなでは顔が丸めに寄り、サイドポニーは出ない)
  • KirazuriはRDBT寄りで、かなのトリガー一発では3枚中2枚が獣娘に振れ、髪色も学習素材と合わない。重い指定で制服には戻るが、素直とは言いにくい
  • AnimaIkaはWAI-Animaに一番近い出方で挙動は安定寄り。トリガー一発ではサイドポニーが出ず、猫耳に振れることもある。特段の不満はないが、ここまで似ているとならWAI-Animaでよくないかという気もして、使いどころが正直分からない。あえて挙げるなら、ついでに獣耳も出したいときくらいか

主観込みだが、出てきた絵で一番良かったのはAnimaYume。当たった1枚の濃さと色の明るさで他を上回っていた。ただし安定して出したいなら結局プロンプトを盛る前提になる。

RDBTはTurboを外しても直らない

RDBTは蒸留モデルで、Turbo LoRAを重ねると蒸留が二重になる。この崩れがTurboのせいかを切り分けるため、Turboを外したRDBT単体でも軽い指定を撃ったが、結果は変わらず崩れたまま。Turbo併用版が軍装方向に振れるのに対し、Turboなし版は獣耳を残したまま水着方向に寄る(露出が出るので画像は割愛)。振れ先は違うが獣耳が消えずキャラが飲まれる点は同じで、崩れの主因はTurboではなくRDBT自身。

参考リンク