SeaArt LoRA作成 実践編 - 思った通りに作るために
概要
前編でSeaArtを使ったLoRA学習の基本を書いた。今回は実際にLoRAを作成してみた実践記録。
結論から言うと、全体的に微妙な結果になった。原因と学んだことをまとめる。
事前準備
学習データの準備
- ツール: アンチグラビティ(Antigravity)
- 処理内容:
- 顔アップ、バストアップ、全身に自動クリップ&リサイズ
- 最初1024四方→512x512の矩形内に収まる内容に切り取り
- 同時にキャプション(タグ)を自動生成
- その後、手動で修正
ファイル構成
dataset/
├── image001.png (512x512)
├── image001.txt (キャプション)
├── image002.png
├── image002.txt
└── ...
学習データのサンプル
実際に使った学習データの見本。
キャプション例
トリガーワードは kanachan(造語)で作成。キャプションはClaudeで自動生成し、手動で微調整した。
全身:
kanachan, 1girl, hoodie, t-shirt, sweatpants, v sign, smile, looking at viewer, standing, monochrome, greyscale, manga, cowboy shot, white background
バストアップ:
kanachan, 1girl, hoodie, t-shirt, v sign, smile, looking at viewer, monochrome, greyscale, manga, upper body, white background
顔アップ:
kanachan, 1girl, hoodie, smile, looking at viewer, monochrome, greyscale, manga, portrait, close up, white background
最終的な学習データ
- 104枚
- モノクロ素材で構成
- バリエーション: 顔アップ、バストアップ、全身、様々なシチュエーション
プラン選択

検討したプラン
| プラン | 月額 | スタミナ/日 | 特徴 |
|---|---|---|---|
| Free | 無料 | 150 | - |
| 初級 | - | 300 | 3日無料トライアルあり |
| スタンダード | 1,440円 | 700 | LoRAトレーニング優先権なし、同時1タスク |
| プロ | 4,300円 | 2,100 | 複数LoRA同時可能 |
最初の選択: スタンダード
- LoRAトレーニング権あり(空いてると速い)
- 700スタミナ/日で104枚の学習は回せる見込み
- 同時に1個のLoRAタスクをトレーニング可能
1回目の学習 - Illustriousで失敗

設定
| 項目 | 設定値 |
|---|---|
| 基本モデル | Illustrious v0.1 |
| トリガーワード | kanachan |
| Repeat | 4 |
| Epoch | 10 |
| 総ステップ数 | 4,160 |
FLUXが最初に選択されていたが、RTX 4060 8GBでは厳しいのでIllustrious v0.1に変更。v1.0もあるが、v0.1の方が安定してる報告が多いためこちらを選択。
プレビュープロンプト
学習中の確認用:
kanachan, 1girl, cardigan, shirt, necktie, smile, upper body, monochrome, greyscale
スタミナ消費の調整
- Repeat 5, Epoch 10: 予想消費 786.47 → スタミナ 758 で足りない
- Repeat 4, Epoch 10: 予想消費 約600 → スタミナ内に収まった
結果: 失敗

- サイドポニーの髪型が全く再現されない
- LoRA 1〜5: 顔の特徴も元データと全然違う
- LoRA 7〜8: ようやく髪を結び始めた(遅すぎ)
- LoRA 9〜10: 少しマシになったがまだ不十分
- モノクロ指定なのにグレーっぽいカラーで出力される
- 体つきが全然似ていない
失敗原因
- Repeat 4では学習が浅すぎた - 104枚 × Repeat 4 = 1枚あたり40回しか学習してない
- Illustrious v0.1とモノクロ漫画の相性が悪い
- スタミナ消費が予想より多かった(予想600台 → 実際700消費)
loss値とEpoch/Repeatの理解
loss値の見方
| loss値 | 状態 |
|---|---|
| 0.2〜0.3以上 | まだ全然学習できてない |
| 0.1前後 | 学習途中 |
| 0.05以下 | よく学習できてる(低すぎると過学習) |
1回目の学習中、loss値は 0.106 → 0.112(半分経過時点)で、学習途中のまま終わっていた。
EpochとRepeatの意味
- Epoch: スナップショット的にLoRAが保存される回数。Epoch 10なら LoRA 1〜10 が生成される
- Repeat: 1エポック内で同じ画像を何回繰り返し学習するか
典型的なパターン:
- LoRA 1〜3 → 学習浅い、特徴弱い
- LoRA 5〜7 → ちょうどいい
- LoRA 8〜10 → 過学習気味の可能性
プロプランへのアップグレード
問題
- スタンダードプランの700スタミナ/日では足りない
- Repeatを上げるとさらにスタミナ消費が増える
- 何回も試行錯誤するには厳しい
- トレーニング優先権あり(違いはよくわからない)
決断: プロプラン(4,300円/月)
PC買うのに比べれば安い。RTX 4090は25〜30万円、VRAM 24GB必要、電気代もかかる。それと比べたら4,300円で何回でも試行錯誤できるのはコスパいい。
2回目の学習 - Anythingで改善
設定
| 項目 | 設定値 |
|---|---|
| 基本モデル | Anything(万象熔炉)SD1.5系 |
| Repeat | 10(4から大幅アップ) |
| Epoch | 15 |
| 総ステップ数 | 15,600(1回目の約4倍) |
| 予想消費スタミナ | 603 |
SD1.5系を選んだ理由
- モノクロ漫画との相性がいい
- 学習も軽い
- 特徴を拾いやすい傾向がある
- RTX 4060でローカル生成が余裕
結果: 大幅改善

- LoRA 1の時点でサイドポニーがちゃんと出てる
- Illustriousは LoRA 9〜10 でやっと出たのに、Anythingは最初から特徴を捉えている
- Repeat 10 に上げた効果 + SD1.5系との相性
生成テスト
プロンプト:
kanachan, かなちゃん, 1girl, カーディガン, シャツ, ネクタイ, スマイル, アッパーボディ, モノクローム, グレースケール
残る問題
- LoRA後半(13〜15)で暗くなりすぎる傾向
- 服の造形が少し変(カーディガンとシャツの境目など)
3回目の学習 - 調整版
設定
| 項目 | 設定値 |
|---|---|
| 基本モデル | Anything(万象熔炉) |
| Repeat | 10 |
| Epoch | 12(15から減らして過学習防止) |
| 予想消費スタミナ | 492.48 |
結果: 安定
- 全体的に安定した出力
- LoRA 9〜10 あたりがバランス良い
- サイドポニーもちゃんと出る
- 顔の特徴も安定
- LoRA 11〜12 は若干過学習っぽい(服がパーカーに固定される傾向)
オンラインでの生成テスト
バストアップ: 良好
プロンプト:
kanachan, 1girl, cardigan, shirt, necktie, smile, upper body, monochrome, greyscale, white background, simple background
ネガティブ:
dark, high contrast, black background, shadow, colorful
結果:
- サイドポニー ✓
- アホ毛 ✓
- カーディガン+シャツ+ネクタイ ✓
- 白背景 ✓
- 明度も良い
気になる点として、顔の雰囲気が元と少し違う(目の形、輪郭など)。
全身: ダメ
テストしたプロンプト(食パン咥えて走る遅刻シーン):
kanachan, 1girl, cardigan, shirt, necktie, running, bread in mouth, toast, late for school, street, motion blur, monochrome, greyscale, full body
結果: 全然違うキャラになった
- 顔も髪型もkanachanじゃない
- 全身だとLoRAの効きが弱くなる
- 学習データにバストアップが多かったため、全身では特徴が薄れる
メイド衣装: 良好
プロンプト:
kanachan, 1girl, maid, maid headdress, maid apron, smile, upper body, monochrome, greyscale, white background, simple background
ネガティブ:
dark, high contrast, shadow, colorful
トラブルシューティング
アップグレード広告モーダル問題

「今すぐトレーニング」を押すと、プロプランへのアップグレードを促すモーダルが表示され、進めなくなった。
試した対処法:
- 右上の×ボタン → 効かない
- モーダル外の暗い部分クリック → 効かない
- Escキー → 効かない
解決方法: ブラウザをリロード
副作用: リロードしたところ、押した回数分だけトレーニングタスクが登録されていた(5件)。トレーニング履歴ページから不要なタスクを削除して対処。

LoRA選択ミス
生成時に「LoRAとベースモデルが一致していません」エラー。Anythingで作ったLoRAを使おうとしたのに、間違えてIllustriousで作った古いLoRAを選んでいた。
UI上では正しく変更されているように見えるのに、内部的には前の設定が残っているという謎の挙動だった。
教訓:
- LoRA名をわかりやすくつける(例:
kanachan_anything_mono) - Anything(SD1.5系)で作ったLoRA → SD1.5系で使う
- Illustrious(SDXL系)で作ったLoRA → SDXL系で使う
- UIの表示を信じず、前からの引き継ぎもせず、新規でやり直した方が失敗が少ない
総括
試行錯誤の流れ
| 回 | モデル | Repeat | Epoch | 結果 |
|---|---|---|---|---|
| 1 | Illustrious v0.1 | 4 | 10 | ❌ 失敗(特徴出ない) |
| 2 | Anything | 10 | 15 | △ 良いが後半で過学習 |
| 3 | Anything | 10 | 12 | ✓ LoRA 9〜10が安定 |
結論: 全体的に微妙
原因は枚数ではなく解像度だと思う。
- 512四方推奨だったが、実際は1024/2048四方の画像も混在していた
- SeaArt側の取り込みに任せて投げっぱなしにしていた → 手前で解像度を揃えるべきだった
- キャプション(タグ)もAIに丸投げして精査していなかった
- 数が多いと精査が辛い
- 生成画像は特徴をつかんでいるので、枚数の問題ではなさそう
今後
暇があったらまたやってみようと思うが、これだとカラー版作る元気がないな〜。
おまけ

※Antigravity上でGemini 3.0 Proによる編集
ここまで持って行くのは結構大変……。