Qwen Image Editでポーズ・角度制御を改善する方法を調べた

M1 MaxでQwen Image Edit v16を動かしたが、ポーズや角度の制御が難しかった。キャラの造形は維持できるものの、変化をつけようとすると崩れたり、意図しない方向に変わったりする。

使っていたPhr00t AIO版のベースを調べたところ:

バージョン	ベース
v16	Qwen-Image-Edit-2509
v18	2511へシフト中（2509と2511のミックス）
v20以降	100% Qwen-Image-Edit-2511

v16は2509ベースで、v18で「造形追随性が悪い」と感じたのは2511への移行中だったからかもしれない。

ただし、開発者によると:

「v19 is likely best for consistency in edits, while v23 is likely best for prompt adherence.」

バージョン	特徴
v19	編集の一貫性が最高（キャラ追随性重視）
v23	プロンプト追従性が最高（キャラ追随性は低い）

キャラの造形を維持したいならv19が最適。v23はプロンプトに従う方向に振っていて、キャラ追随性は下がっている。なお、Phr00t AIO版は開発終了予定とのこと。

改善策を調べていたら、Nunchaku量子化版やVNCCS Pose Studioというツールも見つけたので整理した。

Nunchaku量子化版

QuantFunc/Nunchaku-Qwen-Image-EDIT-2511は、Qwen-Image-Edit-2511を4bit量子化したバージョン。公式2511の機能（自然言語での局所編集、Image drift軽減、キャラクター一貫性向上）はそのまま使える。

バリアント	特徴
best_quality (r256)	最高品質
balance (r128)	バランス型
ultimate_speed (r32)	最高速度

VRAMの少ないGPUでも動かせる。ただしNVIDIA GPU専用。INT4/NVFP4量子化はNVIDIA向けに最適化されており、Mac MPSでは動作しない。

VNCCS Pose Studio

ComfyUI_VNCCS_Utilsに含まれるツール。3DマネキンでポーズをGUI操作して、Qwen Image Editに渡すという仕組み。

Qwen Image Editとの関係

	Qwen Image Edit	VNCCS Pose Studio
種類	画像編集AIモデル	ComfyUIノード群（拡張機能）
単体で動く？	Yes	No（Qwen Image Editが必要）
指示方法	テキスト「腕を上げて」	3Dギズモで関節を直接操作

競合ではなく、組み合わせて使うもの。

構成

Pose Studio: 3Dマネキン操作、照明設定（クリスタのデッサン人形に近い）
QWEN Detailer: 顔・手などの細部強化
Visual Camera Control: カメラアングル制御
専用LoRA: VNCCS_PoseStudioQIE2511_V1.safetensors

使いどころ

テキスト指示で十分なケース:

「髪の色を変えて」「背景を海に」
ざっくりしたポーズ変更「座らせて」「振り向かせて」

VNCCS Pose Studioが必要なケース:

厳密なポーズ指定（例: 右手を45度上げて、左足を少し曲げて）
アニメーション・連続ポーズの作成

必要スペック

VNCCS + Qwenで約23.5GB VRAM。M1 Max 64GBなら統合メモリで動く可能性はあるが、未検証。

セットアップのハマりポイント

参考記事によると、以下の点で躓きやすい。

LoRAの配置場所

StabilityMatrixの共有モデルフォルダではなく、ComfyUIパッケージ直下の models/loras/ に置く必要がある。

ComfyUI/models/loras/qwen/VNCCS/VNCCS_PoseStudioQIE2511_V1.safetensors

VNCCSのModel Managerはパッケージ直下からの相対パスを参照するため、共有フォルダに置くと「Not Installed」のまま認識されない。

GGUF量子化レベルの選定

レベル	サイズ	精度	対象環境
Q5_0	10GB	低い（顔のディテール甘い）	VRAM節約向け
Q8_0	15GB	バランス良い	24GB VRAMならこれ
BF16	38GB	最高（元モデル同等）	96GB VRAM向け

Q5_0だと人物の再現度が低く、BF16にすると体感で明確に違うとのこと。M1 Max 64GBならBF16も載る可能性はあるが、MPSで動くかは別問題。現実的にはQ8_0（15GB）が狙い目か。

公式2511の改善点

Qwen-Image-Edit-2511（2025年12月リリース）は、造形追随性に関する改善が入っている。

改善項目	内容
Image drift軽減	編集時に元画像から大きく変わってしまう問題を解決
キャラクター一貫性向上	グループ写真でも人物のアイデンティティを維持
局所編集	変えたい部分だけ変えて、他はそのまま

v16/v18で経験した「変化をつけると崩れる」問題に効く可能性がある。

従来のi2iとの違い

普通のimg2imgは「denoise強度」で制御するため、強くするとキャラが崩れる、弱くすると変化しない、というジレンマがあった。Qwen Image Editは自然言語で「何を変えるか」を指定できるため、変えたい部分だけピンポイントで編集できる。2511ではこの精度がさらに上がっている。

Mac M1 Maxで2511ベースを動かすには

2509ベースのv16ではなく、2511ベースをMacで動かす場合の選択肢。

方法	特徴
qwen-image-mps	CLIツール、pip installで簡単、遅い（1枚数十分）
ComfyUI + GGUF	ワークフロー使える、Q8_0で15GB

qwen-image-mps

pip install qwen-image-mps

# 超高速モード（4ステップ）
qwen-image-mps edit -uf -i input.png -p "change pose to sitting"

GitHub - qwen-image-mps

ComfyUI + GGUF

cd ComfyUI/custom_nodes
git clone https://github.com/city96/ComfyUI-GGUF
pip install --upgrade gguf

モデル: unsloth/Qwen-Image-Edit-2511-GGUF

次に試すこと

キャラ追随性重視のモデルを試す
- Phr00t AIO v19: キャラ追随性が最高とされている（開発終了予定だが）
- 公式2511 + qwen-image-mps: SFW、CLIで手軽に試せる
改善されていたら、VNCCS Pose Studioでポーズ精密制御を追加