技術
約5分で読めます
SeaArt LoRA学習ガイド
概要
ローカルでLoRA学習環境を構築しようとしたが、「クラウドでもいいんじゃない?」という話があった。
調べたらSeaArt(たまたま課金してた)で学習データを投げてLoRA作れることが判明。環境構築不要でsafetensorsをダウンロードすればローカル生成できる。
メリット
- 環境構築不要(クラウドで学習)
- GPU不要で学習可能
- safetensorsでダウンロード → ローカルで使える
- FLUX/SDXL/Pony/Illustriousなど多彩なベースモデル対応
料金(2025年12月時点)
| プラン | スタミナ/日 | 備考 |
|---|---|---|
| Free | 0 | LoRA公開必須 |
| Beginner SVIP | 300 | 非公開LoRA可、3日無料トライアルあり |
| Standard SVIP | 700 | - |
| Professional SVIP | 2,100 | - |
- トレーニングは全プランで利用可能(スタミナ消費)
- 無料プランはLoRAを公開しないと使用できない
- 非公開でLoRAを使いたいなら有料プラン必須
事前準備
学習データ
- 画像: 200枚(カラー/モノクロ各100枚)
- サイズ: 512x512(ツールで自動クリップ&リサイズ)
- バリエーション: 顔アップ、バストアップ、全身
- キャプション: 自動生成後に手修正済み
ファイル構成
dataset/
├── image001.png (512x512)
├── image001.txt (キャプション)
├── image002.png
├── image002.txt
└── ...
SeaArt LoRA学習手順
1. アカウント作成 & ログイン
SNSアカウントで簡単にログイン可能。
2. トレーニングページへ移動
「創作 → トレーニング → データセット作成」
3. ベースモデルを選択
ローカル生成時のGPU(今回はRTX 4060 8GB)で動くモデルに合わせて選ぶ。VRAM 8GBならSDXL系が動作する。
| モデル | ベース | 特徴 | 4060対応 |
|---|---|---|---|
| Illustrious-XL | SDXL | イラスト特化 | ○ |
| AuthakuMix | Pony | アニメ特化 | ○ |
| NoobAI-XL | SDXL | 汎用 | ○ |
| FLUX | FLUX | 最新・高品質 | × 厳しい |
注意: SDXL系LoRAはSDXL系モデルでのみ使用可能。
4. データセットアップロード
「キャプション付き画像がある場合はデータセットアップロードを使用」
- 画像とtxtファイルをセットでアップロード
- ファイル名を揃えておけば自動で紐づく
- タグ付けアルゴリズムはスキップ(既にキャプションあるため)
5. キャプション確認
アップロード後に確認するポイント:
✓ トリガーワード(造語)が先頭にある
✓ 英語タグ、カンマ区切り
✓ キャラ固有の特徴(髪色、目色など)は削除済み
✓ 構図タグが正しく入っている
構図タグの例
| クリップ | タグ |
|---|---|
| 顔アップ | portrait, close up, face |
| バストアップ | upper body |
| 全身 | full body |
6. 学習パラメータ設定
200枚の場合の推奨設定
| 項目 | 推奨値 |
|---|---|
| リピート数 | 5(枚数多いので下げる) |
| エポック数 | 10 |
| バッチサイズ | 2 |
| 学習率 | 0.0001(1e-4) |
| ネットワークサイズ(Dim) | 64〜128 |
| ネットワークAlpha | Dimの半分(32〜64) |
| スケジューラー | cosine_with_restarts |
| オプティマイザー | AdamW または DAdaptation |
ステップ数の目安
100枚: リピート10 × エポック10 = 10,000ステップ
200枚: リピート5 × エポック10 = 10,000ステップ
7. プレビュープロンプト設定
学習後のサンプル画像生成用:
my_chara, 1girl, upper body, smile, simple background
8. トレーニング開始
「データセット名を入力 → 今すぐトレーニング」
- 順番待ちあり(混雑時は2〜4時間)
- ブラウザ閉じても学習は進む
- 有料プランなら優先権で待ち時間短縮
9. 学習完了 → ダウンロード
「トレーニング履歴 → タスク完了を確認」
- エポックごとにサンプル画像が表示される
- 出来がいいエポックを選択
- 「ダウンロード」→ ローカルにsafetensors保存
- 「セーブ」→ SeaArt上に保存(非公開設定可能)
カラー/モノクロ LoRAを分ける
両方作成する場合
| LoRA | トリガーワード | 用途 |
|---|---|---|
| カラー版 | my_chara_color | 表紙、カラーページ |
| モノクロ版 | my_chara_mono | 漫画本編 |
トリガーワードを分けておくと使い分けしやすい。
モノクロ生成時のプロンプト
プロンプト:
my_chara_mono, 1girl, upper body, smile, monochrome, greyscale, manga, lineart
ネガティブ:
color, colorful
最初からモノクロで生成するのが一番綺麗。カラー→グレスケ変換は劣化する。
ローカルでの使用
ダウンロードしたsafetensorsの配置
ComfyUI:
ComfyUI/models/loras/my_chara.safetensors
A1111:
stable-diffusion-webui/models/Lora/my_chara.safetensors
RTX 4060 8GB での生成
- SDXL系モデル → 動く
- LoRA + ControlNet同時使用 → VRAM厳しめだが動く
- ComfyUIのほうがVRAM効率いい
ControlNetで構図指定
ワークフロー
1. Clip Studioで3Dデッサン人形ポーズ作成
2. PNG出力(512x512、白背景)
3. ControlNet(Depth推奨)に入力
4. LoRA適用して生成
ControlNetの種類
| 種類 | クリスタ3Dとの相性 | 用途 |
|---|---|---|
| Depth | ◎ | 立体感そのまま維持 |
| OpenPose | ○ | ポーズだけ抽出 |
| Canny | △ | 輪郭線が邪魔になることも |
3DからならDepthが一番安定。
セキュリティ / 公開設定
プランによる違い
| プラン | LoRA公開 | 備考 |
|---|---|---|
| 無料 | 必須 | 公開しないとSeaArt上で使用不可 |
| 有料 | 任意 | 非公開のまま保存・使用可能 |
安全に使うには
- 有料プランで非公開設定 → SeaArt上で自分だけ使える
- safetensorsでダウンロード → 完全にローカル保存、他人に使われない
- モデルマーケットに投稿しない
無料プランでもsafetensorsをダウンロードしてローカルで使えば、他人に使われることはない。
詳細設定
学習率 & オプティマイザー
| オプティマイザー | 特徴 | Learning Rate |
|---|---|---|
| AdamW | 標準、安定 | 0.0001 |
| AdamW8bit | 軽量版 | 0.0001 |
| DAdaptation | 自動調整 | 1 |
| DAdaptAdam | 自動調整 | 1 |
| Prodigy | 自動調整 | 1(自動設定) |
ネットワーク設定
| 項目 | 説明 | 推奨値 |
|---|---|---|
| Dim | 高いほど細かい特徴を反映 | 64〜128 |
| Alpha | 低いとLoRAが強く適用 | Dimの半分 |
スケジューラー
| 種類 | 特徴 |
|---|---|
| cosine_with_restarts | 安定、複数画風向け(推奨) |
| cosine | 滑らかな減少 |
| constant_with_warmup | 初期安定化 |
トラブルシューティング
特徴が出ない
- 学習ステップ数を増やす(エポック数UP)
- Dimを上げる(64→128)
- トリガーワードがプロンプトに入ってるか確認
特徴が強すぎる / 崩れる
- リピート数を下げる
- バッチサイズを上げる
- エポック数を下げる
特定のポーズに固定される
- 学習データのバリエーションが足りない
- 構図タグ(upper body等)が正しく入ってるか確認
まとめ
推奨フロー
- SeaArt有料プラン1ヶ月に加入
- カラーLoRAを学習 → safetensorsダウンロード
- モノクロLoRAを学習 → safetensorsダウンロード
- RTX 4060 + ComfyUIでローカル生成
- ControlNet(Depth) + クリスタ3Dで構図指定
- 漫画コマ量産
ポイント
- ベースモデルはSDXL系(Pony/Illustrious)
- 200枚ならリピート5 × エポック10
- トリガーワードはカラー/モノクロで分ける
- 生成は最初からモノクロで出す(後変換は劣化する)
- LoRAは非公開設定で他人に使われない
後編では、実際に学習データを投げてLoRAを作成し、出力結果を見ながら調整していく流れを書く予定。