Qwen-Image-Edit-2511をローカルで動かすのに必要なスペック
Qwen-Image-Edit-2511のマルチアングルLoRAが気になったので、ローカルで動かすために必要なスペックを調べた。
Qwen-Image-Edit-2511とは
Qwen(通義千問)が公開した画像編集モデル。テキスト指示による画像編集、インペインティング、アウトペインティングなどに対応する。
今回特に興味があるのは fal/Qwen-Image-Edit-2511-Multiple-Angles-LoRA。96種類のカメラアングル(4仰角 × 8方位角 × 3距離)を指定して画像を再生成できるLoRA。Gaussian Splattingのレンダリング画像3000枚以上で学習されている。
モデル概要
| 項目 | 値 |
|---|---|
| パラメータ数 | 20B |
| ベースモデルサイズ | 57.7GB |
| LoRAサイズ | 数百MB |
量子化レベル別の要件
量子化すればVRAMを節約できるが、品質とのトレードオフがある。
| 量子化 | モデルサイズ | 必要VRAM | 品質 |
|---|---|---|---|
| FP32 | 57.7GB | 40GB+ | 最高 |
| BF16 | 約30GB | 24GB+ | 高 |
| FP8 | 約15GB | 6GB〜 | FP16相当 |
| NF4 | 約10GB | 16〜20GB | 良好 |
| GGUF Q4_K_M | 13.1GB | CPU実行可 | 実用的 |
FP8量子化はFP16とほぼ同等の品質を維持しつつVRAMを半減できるので、バランスが良い。
Windows推奨スペック
最小構成(FP8量子化)
| パーツ | スペック |
|---|---|
| GPU | RTX 3060 12GB 以上 |
| RAM | 32GB |
| ストレージ | SSD 100GB以上の空き |
| OS | Windows 10/11 64bit |
FP8量子化版 + Lightning LoRA(4ステップ推論)で動作する。遅いが動く。
推奨構成
| パーツ | スペック |
|---|---|
| GPU | RTX 4070 Ti 16GB / RTX 4070 Ti Super 16GB |
| RAM | 64GB |
| ストレージ | NVMe SSD 200GB以上 |
NF4量子化またはFP8で実用的な速度が出る。
快適構成
| パーツ | スペック |
|---|---|
| GPU | RTX 4090 24GB |
| RAM | 64GB |
| ストレージ | NVMe SSD 200GB以上 |
FP8で快適動作。BF16も視野に入る。
ハイエンド構成
| パーツ | スペック |
|---|---|
| GPU | RTX 4090 24GB × 2 / A100 40GB |
| RAM | 128GB |
| ストレージ | NVMe SSD 500GB以上 |
フルプレシジョン(FP32/BF16)で動作。業務用途向け。
Mac推奨スペック
Apple Siliconはユニファイドメモリを活用するため、メモリ容量が重要。Intel Macは非推奨。
最小構成
| パーツ | スペック |
|---|---|
| チップ | M1 Pro / M2 Pro |
| メモリ | 32GB |
| ストレージ | 256GB以上の空き |
GGUF量子化版のみ。動くが遅い。
推奨構成
| パーツ | スペック |
|---|---|
| チップ | M3 Max / M4 Max |
| メモリ | 64GB |
| ストレージ | 512GB以上の空き |
GGUF版で実用的な速度が出る。
快適構成
| パーツ | スペック |
|---|---|
| チップ | M3 Ultra / M4 Ultra |
| メモリ | 128GB以上 |
| ストレージ | 1TB以上 |
大きめの量子化でも余裕がある。
概算コスト(2026年1月時点)
2024年後半からDRAM価格が高騰しており、DDR5 64GB(32GB×2)が10万円超え、128GB(64GB×2)が17〜25万円になっている。GPUもAI需要で品薄が続き、RTX 4090は45万円前後まで上昇。2027〜2028年まで正常化は見込めないとの予測もある。
Windows
| 構成 | GPU | メモリ | PC全体の概算 |
|---|---|---|---|
| 最小 | RTX 3060 12GB | 32GB | 20〜25万円 |
| 推奨 | RTX 4070 Ti Super 16GB | 64GB | 50〜60万円 |
| 快適 | RTX 4090 24GB | 64GB | 70〜80万円 |
GPU単体の参考価格:
- RTX 3060 12GB: 4〜5万円
- RTX 4070 Ti Super 16GB: 24万円〜
- RTX 4090 24GB: 45万円〜
Mac
| 構成 | 機種 | 概算 |
|---|---|---|
| 最小 | MacBook Pro M3 Pro 36GB | 40万円〜 |
| 推奨 | MacBook Pro M3 Max 64GB | 55万円〜 |
| 快適 | Mac Studio M3 Ultra 128GB | 80万円〜 |
実行環境
必須ソフトウェア
- Python 3.10以上
- ComfyUI(推奨)または Diffusers
- CUDA Toolkit(Windows NVIDIA GPU使用時)
高速化オプション
- Lightning LoRA: 推論ステップを40→4に削減
- SageAttention: メモリ使用量削減
- FP8混合精度: 品質維持しつつVRAM節約
クラウドGPUという選択肢
ローカル構築に70万円かけるなら、クラウドGPUも検討する価値がある。
RunPod 料金(2026年1月時点)
| GPU | Community Cloud | Secure Cloud | 割引(Spot) |
|---|---|---|---|
| RTX 4090 | $0.34/時間(¥51) | $0.59/時間(¥89) | 約50%割引 |
| RTX 4070 | $0.08/時間(¥12) | - | 約50%割引 |
| RTX 3090 | $0.22/時間(¥33) | $0.46/時間(¥69) | 約50%割引 |
Community Cloudが最安。Spotインスタンスは5秒の警告で中断されるリスクあり。ComfyUIテンプレート完備。
Vast.ai 料金(2026年1月時点・マーケットプレイス)
| GPU | 最安値 | 平均値 | 日本円換算 |
|---|---|---|---|
| RTX 4090 | $0.24/時間 | ~$0.30/時間 | ¥36〜45 |
| RTX 4070 | $0.08/時間 | ~$0.12/時間 | ¥12〜18 |
| RTX 3090 | $0.13/時間 | ~$0.15/時間 | ¥19.5〜22.5 |
ピアツーピアマーケットプレイス形式で最安だが、価格が変動する。Linux Dockerのみサポート。AWS/GCP比で5〜6倍安い。
コスト比較表(時間あたり)
| GPU | クラウド最安 | ローカル購入価格 | 損益分岐点 |
|---|---|---|---|
| RTX 4090 | ¥36/時間 | 45万円(GPU) | 12,500時間(毎日3時間で11年) |
| RTX 4070 | ¥12/時間 | 15万円(GPU) | 12,500時間(毎日3時間で11年) |
| RTX 3090 | ¥19.5/時間 | 10万円(中古) | 5,100時間(毎日3時間で4.5年) |
実例計算:Qwen-Image-Edit推論1回分
Qwen-Image-Edit-2511の推論(40ステップ)が約5分かかる場合:
- RTX 4090クラウド: $0.30/時間 × (5分/60分) = 約¥2.5/回
- ローカルRTX 4090: 購入45万円 ÷ 12,500時間 = 約¥36/時間 × 5分 = ¥3/回(減価償却1年目)
ライトユーザーはクラウドが圧倒的に安い。
まとめ
2026年1月現在、メモリ・GPU価格の高騰でローカルAI環境の構築コストは跳ね上がっている。
- 最小構成(RTX 3060 + 32GB): 20〜25万円
- 推奨構成(RTX 4070 Ti Super + 64GB): 50〜60万円
- 快適構成(RTX 4090 + 64GB): 70〜80万円
ライトユーザーはクラウドGPU、ヘビーユーザーはローカル構築、様子見派は2027年以降のメモリ価格正常化を待つのが現実的な選択肢。