Qwen Image Editでポーズ・角度制御を改善する方法を調べた
M1 MaxでQwen Image Edit v16を動かしたが、ポーズや角度の制御が難しかった。キャラの造形は維持できるものの、変化をつけようとすると崩れたり、意図しない方向に変わったりする。
使っていたPhr00t AIO版のベースを調べたところ:
| バージョン | ベース |
|---|---|
| v16 | Qwen-Image-Edit-2509 |
| v18 | 2511へシフト中(2509と2511のミックス) |
| v20以降 | 100% Qwen-Image-Edit-2511 |
v16は2509ベースで、v18で「造形追随性が悪い」と感じたのは2511への移行中だったからかもしれない。
ただし、開発者によると:
「v19 is likely best for consistency in edits, while v23 is likely best for prompt adherence.」
| バージョン | 特徴 |
|---|---|
| v19 | 編集の一貫性が最高(キャラ追随性重視) |
| v23 | プロンプト追従性が最高(キャラ追随性は低い) |
キャラの造形を維持したいならv19が最適。v23はプロンプトに従う方向に振っていて、キャラ追随性は下がっている。なお、Phr00t AIO版は開発終了予定とのこと。
改善策を調べていたら、Nunchaku量子化版やVNCCS Pose Studioというツールも見つけたので整理した。
Nunchaku量子化版
QuantFunc/Nunchaku-Qwen-Image-EDIT-2511は、Qwen-Image-Edit-2511を4bit量子化したバージョン。公式2511の機能(自然言語での局所編集、Image drift軽減、キャラクター一貫性向上)はそのまま使える。
| バリアント | 特徴 |
|---|---|
| best_quality (r256) | 最高品質 |
| balance (r128) | バランス型 |
| ultimate_speed (r32) | 最高速度 |
VRAMの少ないGPUでも動かせる。ただしNVIDIA GPU専用。INT4/NVFP4量子化はNVIDIA向けに最適化されており、Mac MPSでは動作しない。
VNCCS Pose Studio
ComfyUI_VNCCS_Utilsに含まれるツール。3DマネキンでポーズをGUI操作して、Qwen Image Editに渡すという仕組み。
Qwen Image Editとの関係
| Qwen Image Edit | VNCCS Pose Studio | |
|---|---|---|
| 種類 | 画像編集AIモデル | ComfyUIノード群(拡張機能) |
| 単体で動く? | Yes | No(Qwen Image Editが必要) |
| 指示方法 | テキスト「腕を上げて」 | 3Dギズモで関節を直接操作 |
競合ではなく、組み合わせて使うもの。
構成
- Pose Studio: 3Dマネキン操作、照明設定(クリスタのデッサン人形に近い)
- QWEN Detailer: 顔・手などの細部強化
- Visual Camera Control: カメラアングル制御
- 専用LoRA:
VNCCS_PoseStudioQIE2511_V1.safetensors
使いどころ
テキスト指示で十分なケース:
- 「髪の色を変えて」「背景を海に」
- ざっくりしたポーズ変更「座らせて」「振り向かせて」
VNCCS Pose Studioが必要なケース:
- 厳密なポーズ指定(例: 右手を45度上げて、左足を少し曲げて)
- アニメーション・連続ポーズの作成
必要スペック
VNCCS + Qwenで約23.5GB VRAM。M1 Max 64GBなら統合メモリで動く可能性はあるが、未検証。
セットアップのハマりポイント
参考記事によると、以下の点で躓きやすい。
LoRAの配置場所
StabilityMatrixの共有モデルフォルダではなく、ComfyUIパッケージ直下の models/loras/ に置く必要がある。
ComfyUI/models/loras/qwen/VNCCS/VNCCS_PoseStudioQIE2511_V1.safetensors
VNCCSのModel Managerはパッケージ直下からの相対パスを参照するため、共有フォルダに置くと「Not Installed」のまま認識されない。
GGUF量子化レベルの選定
| レベル | サイズ | 精度 | 対象環境 |
|---|---|---|---|
| Q5_0 | 10GB | 低い(顔のディテール甘い) | VRAM節約向け |
| Q8_0 | 15GB | バランス良い | 24GB VRAMならこれ |
| BF16 | 38GB | 最高(元モデル同等) | 96GB VRAM向け |
Q5_0だと人物の再現度が低く、BF16にすると体感で明確に違うとのこと。M1 Max 64GBならBF16も載る可能性はあるが、MPSで動くかは別問題。現実的にはQ8_0(15GB)が狙い目か。
公式2511の改善点
Qwen-Image-Edit-2511(2025年12月リリース)は、造形追随性に関する改善が入っている。
| 改善項目 | 内容 |
|---|---|
| Image drift軽減 | 編集時に元画像から大きく変わってしまう問題を解決 |
| キャラクター一貫性向上 | グループ写真でも人物のアイデンティティを維持 |
| 局所編集 | 変えたい部分だけ変えて、他はそのまま |
v16/v18で経験した「変化をつけると崩れる」問題に効く可能性がある。
従来のi2iとの違い
普通のimg2imgは「denoise強度」で制御するため、強くするとキャラが崩れる、弱くすると変化しない、というジレンマがあった。Qwen Image Editは自然言語で「何を変えるか」を指定できるため、変えたい部分だけピンポイントで編集できる。2511ではこの精度がさらに上がっている。
Mac M1 Maxで2511ベースを動かすには
2509ベースのv16ではなく、2511ベースをMacで動かす場合の選択肢。
| 方法 | 特徴 |
|---|---|
| qwen-image-mps | CLIツール、pip installで簡単、遅い(1枚数十分) |
| ComfyUI + GGUF | ワークフロー使える、Q8_0で15GB |
qwen-image-mps
pip install qwen-image-mps
# 超高速モード(4ステップ)
qwen-image-mps edit -uf -i input.png -p "change pose to sitting"
ComfyUI + GGUF
cd ComfyUI/custom_nodes
git clone https://github.com/city96/ComfyUI-GGUF
pip install --upgrade gguf
モデル: unsloth/Qwen-Image-Edit-2511-GGUF
次に試すこと
- キャラ追随性重視のモデルを試す
- Phr00t AIO v19: キャラ追随性が最高とされている(開発終了予定だが)
- 公式2511 + qwen-image-mps: SFW、CLIで手軽に試せる
- 改善されていたら、VNCCS Pose Studioでポーズ精密制御を追加