技術 約7分で読めます

無料化したJANIMAとHexer Minimal ToonをM1 Maxでanima-baseと比較、JANIMAは服を勝手に盛り背景は一番控えめだった

いけさん目次

Anima派生6種に自作のかなちゃんLoRAを当てた比較を書いたとき、JANIMAはアーリーアクセス(ダウンロードが有料)だったので外した。そのJANIMAが無料公開された。あわせてHexer Minimal ToonにAnima版が追加されたので、最新のAnima派生2本がそろった。

きっかけは出力がAIっぽくなりすぎる問題だった。Anima系で生成すると書き込みが過剰になって、いかにも生成画像という密度になる。もっとシンプルな絵を素で出せる派生はないか、という動機でこの2本を試した。Hexer Minimal Toonは名前の通り書き込みを意図的に落とすコンセプトなので本命にあたる。

検証環境は以下の通り。各モデルを同一プロンプト・同一シードで並べた。

項目内容
マシンM1 Max(64GB統合メモリ)
環境ComfyUI
基準モデルanima-base-v1.0
比較対象JANIMA v1.0 / Hexer Minimal Toon Anima V1
キャラLoRAkeikana-animabase-v2(Anima-Base学習、かな+けいを1本に焼いた合体LoRA)
出し分けトリガーで単体と2人を切り替え

2本の基本情報

どちらもanima-base系のDiTチェックポイントで、テキストエンコーダ(Qwen3 0.6B)とVAE(Qwen Image VAE)は共通。diffusion_models/ に本体を置いて使う点も同じ。

項目JANIMA v1.0Hexer Minimal Toon Anima V1
作者janxdMexes
ベースanima-base-v1.0Anima
サイズ3.9GB3.9GB(bf16 full)
設計の狙いベースより細部をシャープに、微細な描き込みを足すトゥーンとアニメの中間、書き込みを盛りすぎない
配布旧アーリーアクセス、現在無料無料

JANIMAのモデルカードには「同じ解像度・同じステップ数でも、ベースより細部・テクスチャ・微細な描き込みが増える」と明記されている。つまり書き込みを増やす方向のチューニング。Hexerは逆に「detailed but not too detailed」をうたう。狙いが正反対の2本になっている。

推奨設定

JANIMAは公式に推奨が載っている。Hexerは事情が違う。

設定JANIMAHexer Anima V1
サンプラーer_sde記載なし
CFG約5記載なし
ステップ24〜30(上限50)記載なし

Hexerのモデルページに出ている「40ステップ・836x1254・Euler A / DPM++ 2M Karras・CFG 7」はIllustrious版(SDXL系)の設定で、Anima版にはバージョン個別の推奨がまだ無い。Euler AやDPM++はSDXL向けサンプラーなので、DiTのAnima版にそのまま当てはまるとは限らない。今回はAnima系標準のer_sdeを当てた。Anima版は手探りで設定を決めるしかなく、これ自体が一つの詰まりになっている。

生成条件

各モデルとも部品(テキストエンコーダ・VAE・キャラLoRA)は固定し、UNetだけ差し替えた。キャラ再現はTurbo(8ステップ)で、描き込み比較は各モデルの推奨に寄せたnativeも撮った。

項目Turbonative
Turbo LoRAanima-turbo-lora-v0.1(strength 1.0)なし
ステップ830
CFG1.0base/Hexer 4.5、JANIMA 5
サンプラーer_sde / simpleer_sde / simple
キャラLoRAkeikana-animabase-v2 ep140(strength_model 1.0 / clip 1.0)同左
シード42(固定)42(固定)

画像の内容判定は自分の目視を当てにせず、Codexに各画像を渡して特徴の一致・構図・破綻を見てもらった結果を併記している。

素の画風

キャラLoRAを外して、金髪+白いローブ+金刺繍の棒立ちプロンプトで各チェックポイントの地の画風を見てみる。

anima-base
素 anima-base
JANIMA
素 JANIMA
Hexer
素 Hexer

同じローブでも刺繍と差し色の入り方が違う。JANIMAは金刺繍がびっしり入り濃紺の差し色も足して、衣装の描き込みが一番濃い。Hexerは同じローブをフラットに処理して装飾があっさり、立体感は残すが密度は低い。anima-baseはその中間で、やや色が沈み、うっすらウォーターマークも乗る。ここではモデルカード通り、JANIMAが衣装の細部を盛り、Hexerが装飾を削る。ただし後述する喫茶店シーンでは、この傾向がそのまま背景には当てはまらない。

かなちゃんを全身とバストアップで

kanachan トリガーで、全身立ち絵とバストアップを撮った。かなの識別点は茶髪・向かって右のサイドポニー・1本跳ねるアホ毛・茶目・白シャツ+赤ネクタイ。

anima-base 全身
かな全身 anima-base
JANIMA 全身
かな全身 JANIMA
Hexer 全身
かな全身 Hexer
anima-base バスト
かなバスト anima-base
JANIMA バスト
かなバスト JANIMA
Hexer バスト
かなバスト Hexer

3本ともサイドポニー・アホ毛・茶髪・茶目は出る。差が出たのは衣装で、JANIMAは指定にない服を勝手に重ねてくる。全身ではベージュのサマーセーター(袖なしニット)+赤リボン+エンブレム、バストでは紺のベスト+赤リボンになり、白シャツ+赤ネクタイの指定から外れた。素のローブで金刺繍を盛ったのと同じで、被写体に装飾を足す方向のモデルなので、制服にも一枚重ねる。Hexerは赤ネクタイを残し、全身は引き構図のぶん塗りがあっさり出る。anima-baseはバストのタイが赤リボンタイ寄りに出るが、JANIMAのような重ね着はしない。Codexにキャラ一致を順位付けさせると全身・バストともHexerが一番指定通りで、JANIMAは特徴は出るが制服が崩れる、という読みだった。

けいちゃんを全身とバストアップで

keichan トリガーで同じく全身とバストアップ。けいの識別点は金髪ロング・ぱっつん前髪・ハーフアップのブレイド・後ろ髪の青リボン・青目で、首元はネクタイではなく赤リボンタイ。左右対称の髪型なので、サイドポニーの向きのような交絡が無く、再現のブレが読みやすい。

anima-base 全身
けい全身 anima-base
JANIMA 全身
けい全身 JANIMA
Hexer 全身
けい全身 Hexer
anima-base バスト
けいバスト anima-base
JANIMA バスト
けいバスト JANIMA
Hexer バスト
けいバスト Hexer

けいは評価が分かれた。Codexの判定だと全身はanima-baseが一番安定(手指まで崩れない)で、バストはJANIMAが一番安定(首の赤リボン・後ろ髪の青リボンが自然で線も塗りも安定)。Hexerはバストで首の赤リボンが青になった。かなではHexerが強かったのに、けいでは入れ替わっていて、どのモデルがキャラ再現に強いかはキャラ単位で変わる。

2キャラを1枚に出す

合体LoRAなので、kanachankeichan を1枚に呼んで2人を絡ませられる。2キャラを出すときは位置と各キャラの特徴を自然文で書き分け、they are two different girls と融合避けのネガティブ(fused limbs 等)を入れるのが安定する。左にけい、右にかなを置いてハグさせた。

anima-base
keikana anima-base
JANIMA
keikana JANIMA
Hexer
keikana Hexer

3本とも2人が別キャラとして分離して並び、かなのアホ毛がけい(金髪)に乗る属性移りも起きていない。Codexに分離の良さを順位付けさせると一番はHexerだったが、3本の差は小さい。ただしHexerは首のリボンが青になっていて、色の忠実度はその分落ちる。2キャラの分離はベース由来の挙動なので、派生を変えてもおおむね保たれる。

細かい描写はTurbo有無で変わる

描き込みを見るために、喫茶店で座るかなを背景込みで出した。各モデルの推奨に寄せたnative(30ステップ)と、普段の高速生成にあたるTurbo(8ステップ)の両方。

base Turbo
喫茶店 base turbo
JANIMA Turbo
喫茶店 JANIMA turbo
Hexer Turbo
喫茶店 Hexer turbo
base native
喫茶店 base native
JANIMA native
喫茶店 JANIMA native
Hexer native
喫茶店 Hexer native

Codexに6枚の背景密度と破綻を読ませた結果が分かりやすかった。Turboは人物を大きく寄せて、背景密度が落ちる代わりに顔・上半身・前景の小物が強く出る。nativeは引き構図になって背景・空間・小物の描き込みが増える(ただし白い縁取りの額装風になりやすい)。背景の描き込み量はnative込みで base ≒ Hexer > JANIMA の順で、JANIMAは整理されて綺麗だが背景の情報量は控えめ、という読みだった。

ここが素の画風と逆になる。素のローブではJANIMAが衣装の刺繍を一番盛っていたのに、喫茶店シーンの背景ではJANIMAが一番あっさりする。JANIMAは被写体の細部を盛り、背景は整理して詰め込まない方向に振れていて、Hexerやbaseは背景の小物まで密度を上げる。書き込みの量は、同じモデルでも被写体側と背景側で分かれて出る。

どれを使うか

キャラ再現は得意なモデルがキャラ単位で入れ替わり、常に強い1本は無かった。出したいキャラと構図で選ぶことになる。

当初の動機だったシンプルな絵を素で出す件は、見る場所で答えが変わる。被写体の衣装や小物の描き込みを抑えたいならHexerで、塗りがフラットに出る。背景を散らかしたくないならむしろJANIMAが整理されていて密度が低い。Turboを使えばどのモデルも人物に寄って背景の描き込みが減るので、シンプルに寄せる一番手っ取り早い手はステップを上げないことだった。

Hexer Anima V1にバージョン個別の推奨設定が無いのは使う前に引っかかる点で、サンプラーやCFGはAnima系標準から当たりを付けるしかない。今回の範囲ではer_sde・CFG5・30ステップ(Turboなら8ステップ・CFG1)で普通に出た。

参考リンク