技術 約4分で読めます

Qwen-Image-Edit-2511をローカルで動かすのに必要なスペック

Qwen-Image-Edit-2511のマルチアングルLoRAが気になったので、ローカルで動かすために必要なスペックを調べた。

Qwen-Image-Edit-2511とは

Qwen(通義千問)が公開した画像編集モデル。テキスト指示による画像編集、インペインティング、アウトペインティングなどに対応する。

今回特に興味があるのは fal/Qwen-Image-Edit-2511-Multiple-Angles-LoRA。96種類のカメラアングル(4仰角 × 8方位角 × 3距離)を指定して画像を再生成できるLoRA。Gaussian Splattingのレンダリング画像3000枚以上で学習されている。

モデル概要

項目
パラメータ数20B
ベースモデルサイズ57.7GB
LoRAサイズ数百MB

量子化レベル別の要件

量子化すればVRAMを節約できるが、品質とのトレードオフがある。

量子化モデルサイズ必要VRAM品質
FP3257.7GB40GB+最高
BF16約30GB24GB+
FP8約15GB6GB〜FP16相当
NF4約10GB16〜20GB良好
GGUF Q4_K_M13.1GBCPU実行可実用的

FP8量子化はFP16とほぼ同等の品質を維持しつつVRAMを半減できるので、バランスが良い。

Windows推奨スペック

最小構成(FP8量子化)

パーツスペック
GPURTX 3060 12GB 以上
RAM32GB
ストレージSSD 100GB以上の空き
OSWindows 10/11 64bit

FP8量子化版 + Lightning LoRA(4ステップ推論)で動作する。遅いが動く。

推奨構成

パーツスペック
GPURTX 4070 Ti 16GB / RTX 4070 Ti Super 16GB
RAM64GB
ストレージNVMe SSD 200GB以上

NF4量子化またはFP8で実用的な速度が出る。

快適構成

パーツスペック
GPURTX 4090 24GB
RAM64GB
ストレージNVMe SSD 200GB以上

FP8で快適動作。BF16も視野に入る。

ハイエンド構成

パーツスペック
GPURTX 4090 24GB × 2 / A100 40GB
RAM128GB
ストレージNVMe SSD 500GB以上

フルプレシジョン(FP32/BF16)で動作。業務用途向け。

Mac推奨スペック

Apple Siliconはユニファイドメモリを活用するため、メモリ容量が重要。Intel Macは非推奨。

最小構成

パーツスペック
チップM1 Pro / M2 Pro
メモリ32GB
ストレージ256GB以上の空き

GGUF量子化版のみ。動くが遅い。

推奨構成

パーツスペック
チップM3 Max / M4 Max
メモリ64GB
ストレージ512GB以上の空き

GGUF版で実用的な速度が出る。

快適構成

パーツスペック
チップM3 Ultra / M4 Ultra
メモリ128GB以上
ストレージ1TB以上

大きめの量子化でも余裕がある。

概算コスト(2026年1月時点)

2024年後半からDRAM価格が高騰しており、DDR5 64GB(32GB×2)が10万円超え、128GB(64GB×2)が17〜25万円になっている。GPUもAI需要で品薄が続き、RTX 4090は45万円前後まで上昇。2027〜2028年まで正常化は見込めないとの予測もある。

Windows

構成GPUメモリPC全体の概算
最小RTX 3060 12GB32GB20〜25万円
推奨RTX 4070 Ti Super 16GB64GB50〜60万円
快適RTX 4090 24GB64GB70〜80万円

GPU単体の参考価格:

  • RTX 3060 12GB: 4〜5万円
  • RTX 4070 Ti Super 16GB: 24万円〜
  • RTX 4090 24GB: 45万円〜

Mac

構成機種概算
最小MacBook Pro M3 Pro 36GB40万円〜
推奨MacBook Pro M3 Max 64GB55万円〜
快適Mac Studio M3 Ultra 128GB80万円〜

実行環境

必須ソフトウェア

  • Python 3.10以上
  • ComfyUI(推奨)または Diffusers
  • CUDA Toolkit(Windows NVIDIA GPU使用時)

高速化オプション

  • Lightning LoRA: 推論ステップを40→4に削減
  • SageAttention: メモリ使用量削減
  • FP8混合精度: 品質維持しつつVRAM節約

クラウドGPUという選択肢

ローカル構築に70万円かけるなら、クラウドGPUも検討する価値がある。

RunPod 料金(2026年1月時点)

GPUCommunity CloudSecure Cloud割引(Spot)
RTX 4090$0.34/時間(¥51)$0.59/時間(¥89)約50%割引
RTX 4070$0.08/時間(¥12)-約50%割引
RTX 3090$0.22/時間(¥33)$0.46/時間(¥69)約50%割引

Community Cloudが最安。Spotインスタンスは5秒の警告で中断されるリスクあり。ComfyUIテンプレート完備。

Vast.ai 料金(2026年1月時点・マーケットプレイス)

GPU最安値平均値日本円換算
RTX 4090$0.24/時間~$0.30/時間¥36〜45
RTX 4070$0.08/時間~$0.12/時間¥12〜18
RTX 3090$0.13/時間~$0.15/時間¥19.5〜22.5

ピアツーピアマーケットプレイス形式で最安だが、価格が変動する。Linux Dockerのみサポート。AWS/GCP比で5〜6倍安い。

コスト比較表(時間あたり)

GPUクラウド最安ローカル購入価格損益分岐点
RTX 4090¥36/時間45万円(GPU)12,500時間(毎日3時間で11年)
RTX 4070¥12/時間15万円(GPU)12,500時間(毎日3時間で11年)
RTX 3090¥19.5/時間10万円(中古)5,100時間(毎日3時間で4.5年)

実例計算:Qwen-Image-Edit推論1回分

Qwen-Image-Edit-2511の推論(40ステップ)が約5分かかる場合:

  • RTX 4090クラウド: $0.30/時間 × (5分/60分) = 約¥2.5/回
  • ローカルRTX 4090: 購入45万円 ÷ 12,500時間 = 約¥36/時間 × 5分 = ¥3/回(減価償却1年目)

ライトユーザーはクラウドが圧倒的に安い。

まとめ

2026年1月現在、メモリ・GPU価格の高騰でローカルAI環境の構築コストは跳ね上がっている。

  • 最小構成(RTX 3060 + 32GB): 20〜25万円
  • 推奨構成(RTX 4070 Ti Super + 64GB): 50〜60万円
  • 快適構成(RTX 4090 + 64GB): 70〜80万円

ライトユーザーはクラウドGPU、ヘビーユーザーはローカル構築、様子見派は2027年以降のメモリ価格正常化を待つのが現実的な選択肢。