技術 約7分で読めます

SeaArt LoRA作成 実践編 - 思った通りに作るために

概要

前編でSeaArtを使ったLoRA学習の基本を書いた。今回は実際にLoRAを作成してみた実践記録。

結論から言うと、全体的に微妙な結果になった。原因と学んだことをまとめる。


事前準備

学習データの準備

  • ツール: アンチグラビティ(Antigravity)
  • 処理内容:
    • 顔アップ、バストアップ、全身に自動クリップ&リサイズ
    • 最初1024四方→512x512の矩形内に収まる内容に切り取り
    • 同時にキャプション(タグ)を自動生成
    • その後、手動で修正

ファイル構成

dataset/
├── image001.png  (512x512)
├── image001.txt  (キャプション)
├── image002.png
├── image002.txt
└── ...

学習データのサンプル

実際に使った学習データの見本。

キャプション例

トリガーワードは kanachan(造語)で作成。キャプションはClaudeで自動生成し、手動で微調整した。

全身:

kanachan, 1girl, hoodie, t-shirt, sweatpants, v sign, smile, looking at viewer, standing, monochrome, greyscale, manga, cowboy shot, white background

バストアップ:

kanachan, 1girl, hoodie, t-shirt, v sign, smile, looking at viewer, monochrome, greyscale, manga, upper body, white background

顔アップ:

kanachan, 1girl, hoodie, smile, looking at viewer, monochrome, greyscale, manga, portrait, close up, white background

最終的な学習データ

  • 104枚
  • モノクロ素材で構成
  • バリエーション: 顔アップ、バストアップ、全身、様々なシチュエーション

プラン選択

SeaArt課金プラン

検討したプラン

プラン月額スタミナ/日特徴
Free無料150-
初級-3003日無料トライアルあり
スタンダード1,440円700LoRAトレーニング優先権なし、同時1タスク
プロ4,300円2,100複数LoRA同時可能

最初の選択: スタンダード

  • LoRAトレーニング権あり(空いてると速い)
  • 700スタミナ/日で104枚の学習は回せる見込み
  • 同時に1個のLoRAタスクをトレーニング可能

1回目の学習 - Illustriousで失敗

LoRAトレーニング初期画面

設定

項目設定値
基本モデルIllustrious v0.1
トリガーワードkanachan
Repeat4
Epoch10
総ステップ数4,160

FLUXが最初に選択されていたが、RTX 4060 8GBでは厳しいのでIllustrious v0.1に変更。v1.0もあるが、v0.1の方が安定してる報告が多いためこちらを選択。

プレビュープロンプト

学習中の確認用:

kanachan, 1girl, cardigan, shirt, necktie, smile, upper body, monochrome, greyscale

スタミナ消費の調整

  • Repeat 5, Epoch 10: 予想消費 786.47 → スタミナ 758 で足りない
  • Repeat 4, Epoch 10: 予想消費 約600 → スタミナ内に収まった

結果: 失敗

1回目の学習結果

  • サイドポニーの髪型が全く再現されない
  • LoRA 1〜5: 顔の特徴も元データと全然違う
  • LoRA 7〜8: ようやく髪を結び始めた(遅すぎ)
  • LoRA 9〜10: 少しマシになったがまだ不十分
  • モノクロ指定なのにグレーっぽいカラーで出力される
  • 体つきが全然似ていない

失敗原因

  1. Repeat 4では学習が浅すぎた - 104枚 × Repeat 4 = 1枚あたり40回しか学習してない
  2. Illustrious v0.1とモノクロ漫画の相性が悪い
  3. スタミナ消費が予想より多かった(予想600台 → 実際700消費)

loss値とEpoch/Repeatの理解

loss値の見方

loss値状態
0.2〜0.3以上まだ全然学習できてない
0.1前後学習途中
0.05以下よく学習できてる(低すぎると過学習)

1回目の学習中、loss値は 0.106 → 0.112(半分経過時点)で、学習途中のまま終わっていた。

EpochとRepeatの意味

  • Epoch: スナップショット的にLoRAが保存される回数。Epoch 10なら LoRA 1〜10 が生成される
  • Repeat: 1エポック内で同じ画像を何回繰り返し学習するか

典型的なパターン:

  • LoRA 1〜3 → 学習浅い、特徴弱い
  • LoRA 5〜7 → ちょうどいい
  • LoRA 8〜10 → 過学習気味の可能性

プロプランへのアップグレード

問題

  • スタンダードプランの700スタミナ/日では足りない
  • Repeatを上げるとさらにスタミナ消費が増える
  • 何回も試行錯誤するには厳しい
  • トレーニング優先権あり(違いはよくわからない)

決断: プロプラン(4,300円/月)

PC買うのに比べれば安い。RTX 4090は25〜30万円、VRAM 24GB必要、電気代もかかる。それと比べたら4,300円で何回でも試行錯誤できるのはコスパいい。


2回目の学習 - Anythingで改善

設定

項目設定値
基本モデルAnything(万象熔炉)SD1.5系
Repeat10(4から大幅アップ)
Epoch15
総ステップ数15,600(1回目の約4倍)
予想消費スタミナ603

SD1.5系を選んだ理由

  • モノクロ漫画との相性がいい
  • 学習も軽い
  • 特徴を拾いやすい傾向がある
  • RTX 4060でローカル生成が余裕

結果: 大幅改善

2回目の学習結果

  • LoRA 1の時点でサイドポニーがちゃんと出てる
  • Illustriousは LoRA 9〜10 でやっと出たのに、Anythingは最初から特徴を捉えている
  • Repeat 10 に上げた効果 + SD1.5系との相性

生成テスト

プロンプト:

kanachan, かなちゃん, 1girl, カーディガン, シャツ, ネクタイ, スマイル, アッパーボディ, モノクローム, グレースケール

残る問題

  • LoRA後半(13〜15)で暗くなりすぎる傾向
  • 服の造形が少し変(カーディガンとシャツの境目など)

3回目の学習 - 調整版

設定

項目設定値
基本モデルAnything(万象熔炉)
Repeat10
Epoch12(15から減らして過学習防止)
予想消費スタミナ492.48

結果: 安定

  • 全体的に安定した出力
  • LoRA 9〜10 あたりがバランス良い
  • サイドポニーもちゃんと出る
  • 顔の特徴も安定
  • LoRA 11〜12 は若干過学習っぽい(服がパーカーに固定される傾向)

オンラインでの生成テスト

バストアップ: 良好

プロンプト:

kanachan, 1girl, cardigan, shirt, necktie, smile, upper body, monochrome, greyscale, white background, simple background

ネガティブ:

dark, high contrast, black background, shadow, colorful

結果:

  • サイドポニー ✓
  • アホ毛 ✓
  • カーディガン+シャツ+ネクタイ ✓
  • 白背景 ✓
  • 明度も良い

気になる点として、顔の雰囲気が元と少し違う(目の形、輪郭など)。

全身: ダメ

テストしたプロンプト(食パン咥えて走る遅刻シーン):

kanachan, 1girl, cardigan, shirt, necktie, running, bread in mouth, toast, late for school, street, motion blur, monochrome, greyscale, full body

結果: 全然違うキャラになった

  • 顔も髪型もkanachanじゃない
  • 全身だとLoRAの効きが弱くなる
  • 学習データにバストアップが多かったため、全身では特徴が薄れる

メイド衣装: 良好

プロンプト:

kanachan, 1girl, maid, maid headdress, maid apron, smile, upper body, monochrome, greyscale, white background, simple background

ネガティブ:

dark, high contrast, shadow, colorful

トラブルシューティング

アップグレード広告モーダル問題

アップグレードモーダル

「今すぐトレーニング」を押すと、プロプランへのアップグレードを促すモーダルが表示され、進めなくなった。

試した対処法:

  • 右上の×ボタン → 効かない
  • モーダル外の暗い部分クリック → 効かない
  • Escキー → 効かない

解決方法: ブラウザをリロード

副作用: リロードしたところ、押した回数分だけトレーニングタスクが登録されていた(5件)。トレーニング履歴ページから不要なタスクを削除して対処。

複数タスクが登録された

LoRA選択ミス

生成時に「LoRAとベースモデルが一致していません」エラー。Anythingで作ったLoRAを使おうとしたのに、間違えてIllustriousで作った古いLoRAを選んでいた。

UI上では正しく変更されているように見えるのに、内部的には前の設定が残っているという謎の挙動だった。

教訓:

  • LoRA名をわかりやすくつける(例: kanachan_anything_mono
  • Anything(SD1.5系)で作ったLoRA → SD1.5系で使う
  • Illustrious(SDXL系)で作ったLoRA → SDXL系で使う
  • UIの表示を信じず、前からの引き継ぎもせず、新規でやり直した方が失敗が少ない

総括

試行錯誤の流れ

モデルRepeatEpoch結果
1Illustrious v0.1410❌ 失敗(特徴出ない)
2Anything1015△ 良いが後半で過学習
3Anything1012✓ LoRA 9〜10が安定

結論: 全体的に微妙

原因は枚数ではなく解像度だと思う。

  • 512四方推奨だったが、実際は1024/2048四方の画像も混在していた
  • SeaArt側の取り込みに任せて投げっぱなしにしていた → 手前で解像度を揃えるべきだった
  • キャプション(タグ)もAIに丸投げして精査していなかった
  • 数が多いと精査が辛い
  • 生成画像は特徴をつかんでいるので、枚数の問題ではなさそう

今後

暇があったらまたやってみようと思うが、これだとカラー版作る元気がないな〜。


おまけ

全身デスク作業

※Antigravity上でGemini 3.0 Proによる編集

ここまで持って行くのは結構大変……。