SeaArt LoRA作成実践編 - 思った通りに作るために

概要

前編でSeaArtを使ったLoRA学習の基本を書いた。今回は実際にLoRAを作成してみた実践記録。

結論から言うと、全体的に微妙な結果になった。原因と学んだことをまとめる。

事前準備

学習データの準備

ツール: アンチグラビティ（Antigravity）
処理内容:
- 顔アップ、バストアップ、全身に自動クリップ＆リサイズ
- 最初1024四方→512x512の矩形内に収まる内容に切り取り
- 同時にキャプション（タグ）を自動生成
- その後、手動で修正

ファイル構成

dataset/
├── image001.png  (512x512)
├── image001.txt  (キャプション)
├── image002.png
├── image002.txt
└── ...

学習データのサンプル

実際に使った学習データの見本。

キャプション例

トリガーワードは kanachan（造語）で作成。キャプションはClaudeで自動生成し、手動で微調整した。

全身:

kanachan, 1girl, hoodie, t-shirt, sweatpants, v sign, smile, looking at viewer, standing, monochrome, greyscale, manga, cowboy shot, white background

バストアップ:

kanachan, 1girl, hoodie, t-shirt, v sign, smile, looking at viewer, monochrome, greyscale, manga, upper body, white background

顔アップ:

kanachan, 1girl, hoodie, smile, looking at viewer, monochrome, greyscale, manga, portrait, close up, white background

最終的な学習データ

104枚
モノクロ素材で構成
バリエーション: 顔アップ、バストアップ、全身、様々なシチュエーション

プラン選択

SeaArt課金プラン

検討したプラン

プラン	月額	スタミナ/日	特徴
Free	無料	150	-
初級	-	300	3日無料トライアルあり
スタンダード	1,440円	700	LoRAトレーニング優先権なし、同時1タスク
プロ	4,300円	2,100	複数LoRA同時可能

最初の選択: スタンダード

LoRAトレーニング権あり（空いてると速い）
700スタミナ/日で104枚の学習は回せる見込み
同時に1個のLoRAタスクをトレーニング可能

1回目の学習 - Illustriousで失敗

LoRAトレーニング初期画面

設定

項目	設定値
基本モデル	Illustrious v0.1
トリガーワード	kanachan
Repeat	4
Epoch	10
総ステップ数	4,160

FLUXが最初に選択されていたが、RTX 4060 8GBでは厳しいのでIllustrious v0.1に変更。v1.0もあるが、v0.1の方が安定してる報告が多いためこちらを選択。

プレビュープロンプト

学習中の確認用:

kanachan, 1girl, cardigan, shirt, necktie, smile, upper body, monochrome, greyscale

スタミナ消費の調整

Repeat 5, Epoch 10: 予想消費 786.47 → スタミナ 758 で足りない
Repeat 4, Epoch 10: 予想消費約600 → スタミナ内に収まった

結果: 失敗

1回目の学習結果

サイドポニーの髪型が全く再現されない
LoRA 1〜5: 顔の特徴も元データと全然違う
LoRA 7〜8: ようやく髪を結び始めた（遅すぎ）
LoRA 9〜10: 少しマシになったがまだ不十分
モノクロ指定なのにグレーっぽいカラーで出力される
体つきが全然似ていない

失敗原因

Repeat 4では学習が浅すぎた - 104枚 × Repeat 4 = 1枚あたり40回しか学習してない
Illustrious v0.1とモノクロ漫画の相性が悪い
スタミナ消費が予想より多かった（予想600台 → 実際700消費）

loss値とEpoch/Repeatの理解

loss値の見方

loss値	状態
0.2〜0.3以上	まだ全然学習できてない
0.1前後	学習途中
0.05以下	よく学習できてる（低すぎると過学習）

1回目の学習中、loss値は 0.106 → 0.112（半分経過時点）で、学習途中のまま終わっていた。

EpochとRepeatの意味

Epoch: スナップショット的にLoRAが保存される回数。Epoch 10なら LoRA 1〜10 が生成される
Repeat: 1エポック内で同じ画像を何回繰り返し学習するか

典型的なパターン:

LoRA 1〜3 → 学習浅い、特徴弱い
LoRA 5〜7 → ちょうどいい
LoRA 8〜10 → 過学習気味の可能性

プロプランへのアップグレード

問題

スタンダードプランの700スタミナ/日では足りない
Repeatを上げるとさらにスタミナ消費が増える
何回も試行錯誤するには厳しい
トレーニング優先権あり（違いはよくわからない）

決断: プロプラン（4,300円/月）

PC買うのに比べれば安い。RTX 4090は25〜30万円、VRAM 24GB必要、電気代もかかる。それと比べたら4,300円で何回でも試行錯誤できるのはコスパいい。

2回目の学習 - Anythingで改善

設定

項目	設定値
基本モデル	Anything（万象熔炉）SD1.5系
Repeat	10（4から大幅アップ）
Epoch	15
総ステップ数	15,600（1回目の約4倍）
予想消費スタミナ	603

SD1.5系を選んだ理由

モノクロ漫画との相性がいい
学習も軽い
特徴を拾いやすい傾向がある
RTX 4060でローカル生成が余裕

結果: 大幅改善

2回目の学習結果

LoRA 1の時点でサイドポニーがちゃんと出てる
Illustriousは LoRA 9〜10 でやっと出たのに、Anythingは最初から特徴を捉えている
Repeat 10 に上げた効果 + SD1.5系との相性

生成テスト

プロンプト:

kanachan, かなちゃん, 1girl, カーディガン, シャツ, ネクタイ, スマイル, アッパーボディ, モノクローム, グレースケール

残る問題

LoRA後半（13〜15）で暗くなりすぎる傾向
服の造形が少し変（カーディガンとシャツの境目など）

3回目の学習 - 調整版

設定

項目	設定値
基本モデル	Anything（万象熔炉）
Repeat	10
Epoch	12（15から減らして過学習防止）
予想消費スタミナ	492.48

結果: 安定

全体的に安定した出力
LoRA 9〜10 あたりがバランス良い
サイドポニーもちゃんと出る
顔の特徴も安定
LoRA 11〜12 は若干過学習っぽい（服がパーカーに固定される傾向）

オンラインでの生成テスト

バストアップ: 良好

プロンプト:

kanachan, 1girl, cardigan, shirt, necktie, smile, upper body, monochrome, greyscale, white background, simple background

ネガティブ:

dark, high contrast, black background, shadow, colorful

結果:

サイドポニー ✓
アホ毛 ✓
カーディガン+シャツ+ネクタイ ✓
白背景 ✓
明度も良い

気になる点として、顔の雰囲気が元と少し違う（目の形、輪郭など）。

全身: ダメ

テストしたプロンプト（食パン咥えて走る遅刻シーン）:

kanachan, 1girl, cardigan, shirt, necktie, running, bread in mouth, toast, late for school, street, motion blur, monochrome, greyscale, full body

結果: 全然違うキャラになった

顔も髪型もkanachanじゃない
全身だとLoRAの効きが弱くなる
学習データにバストアップが多かったため、全身では特徴が薄れる

メイド衣装: 良好

プロンプト:

kanachan, 1girl, maid, maid headdress, maid apron, smile, upper body, monochrome, greyscale, white background, simple background

ネガティブ:

dark, high contrast, shadow, colorful

トラブルシューティング

アップグレード広告モーダル問題

アップグレードモーダル

「今すぐトレーニング」を押すと、プロプランへのアップグレードを促すモーダルが表示され、進めなくなった。

試した対処法:

右上の×ボタン → 効かない
モーダル外の暗い部分クリック → 効かない
Escキー → 効かない

解決方法: ブラウザをリロード

副作用: リロードしたところ、押した回数分だけトレーニングタスクが登録されていた（5件）。トレーニング履歴ページから不要なタスクを削除して対処。

複数タスクが登録された

LoRA選択ミス

生成時に「LoRAとベースモデルが一致していません」エラー。Anythingで作ったLoRAを使おうとしたのに、間違えてIllustriousで作った古いLoRAを選んでいた。

UI上では正しく変更されているように見えるのに、内部的には前の設定が残っているという謎の挙動だった。

教訓:

LoRA名をわかりやすくつける（例: kanachan_anything_mono）
Anything（SD1.5系）で作ったLoRA → SD1.5系で使う
Illustrious（SDXL系）で作ったLoRA → SDXL系で使う
UIの表示を信じず、前からの引き継ぎもせず、新規でやり直した方が失敗が少ない

総括

試行錯誤の流れ

回	モデル	Repeat	Epoch	結果
1	Illustrious v0.1	4	10	❌ 失敗（特徴出ない）
2	Anything	10	15	△ 良いが後半で過学習
3	Anything	10	12	✓ LoRA 9〜10が安定

結論: 全体的に微妙

原因は枚数ではなく解像度だと思う。

512四方推奨だったが、実際は1024/2048四方の画像も混在していた
SeaArt側の取り込みに任せて投げっぱなしにしていた → 手前で解像度を揃えるべきだった
キャプション（タグ）もAIに丸投げして精査していなかった
数が多いと精査が辛い
生成画像は特徴をつかんでいるので、枚数の問題ではなさそう

今後

暇があったらまたやってみようと思うが、これだとカラー版作る元気がないな〜。

おまけ

全身デスク作業

※Antigravity上でGemini 3.0 Proによる編集

ここまで持って行くのは結構大変……。