技術 約5分で読めます

Qwen Image Editでポーズ・角度制御を改善する方法を調べた

M1 MaxでQwen Image Edit v16を動かしたが、ポーズや角度の制御が難しかった。キャラの造形は維持できるものの、変化をつけようとすると崩れたり、意図しない方向に変わったりする。

使っていたPhr00t AIO版のベースを調べたところ:

バージョンベース
v16Qwen-Image-Edit-2509
v182511へシフト中(2509と2511のミックス)
v20以降100% Qwen-Image-Edit-2511

v16は2509ベースで、v18で「造形追随性が悪い」と感じたのは2511への移行中だったからかもしれない。

ただし、開発者によると:

「v19 is likely best for consistency in edits, while v23 is likely best for prompt adherence.」

バージョン特徴
v19編集の一貫性が最高(キャラ追随性重視)
v23プロンプト追従性が最高(キャラ追随性は低い)

キャラの造形を維持したいならv19が最適。v23はプロンプトに従う方向に振っていて、キャラ追随性は下がっている。なお、Phr00t AIO版は開発終了予定とのこと。

改善策を調べていたら、Nunchaku量子化版やVNCCS Pose Studioというツールも見つけたので整理した。

Nunchaku量子化版

QuantFunc/Nunchaku-Qwen-Image-EDIT-2511は、Qwen-Image-Edit-2511を4bit量子化したバージョン。公式2511の機能(自然言語での局所編集、Image drift軽減、キャラクター一貫性向上)はそのまま使える。

バリアント特徴
best_quality (r256)最高品質
balance (r128)バランス型
ultimate_speed (r32)最高速度

VRAMの少ないGPUでも動かせる。ただしNVIDIA GPU専用。INT4/NVFP4量子化はNVIDIA向けに最適化されており、Mac MPSでは動作しない。

VNCCS Pose Studio

ComfyUI_VNCCS_Utilsに含まれるツール。3DマネキンでポーズをGUI操作して、Qwen Image Editに渡すという仕組み。

Qwen Image Editとの関係

Qwen Image EditVNCCS Pose Studio
種類画像編集AIモデルComfyUIノード群(拡張機能)
単体で動く?YesNo(Qwen Image Editが必要)
指示方法テキスト「腕を上げて」3Dギズモで関節を直接操作

競合ではなく、組み合わせて使うもの。

構成

  • Pose Studio: 3Dマネキン操作、照明設定(クリスタのデッサン人形に近い)
  • QWEN Detailer: 顔・手などの細部強化
  • Visual Camera Control: カメラアングル制御
  • 専用LoRA: VNCCS_PoseStudioQIE2511_V1.safetensors

使いどころ

テキスト指示で十分なケース:

  • 「髪の色を変えて」「背景を海に」
  • ざっくりしたポーズ変更「座らせて」「振り向かせて」

VNCCS Pose Studioが必要なケース:

  • 厳密なポーズ指定(例: 右手を45度上げて、左足を少し曲げて)
  • アニメーション・連続ポーズの作成

必要スペック

VNCCS + Qwenで約23.5GB VRAM。M1 Max 64GBなら統合メモリで動く可能性はあるが、未検証。

セットアップのハマりポイント

参考記事によると、以下の点で躓きやすい。

LoRAの配置場所

StabilityMatrixの共有モデルフォルダではなく、ComfyUIパッケージ直下の models/loras/ に置く必要がある。

ComfyUI/models/loras/qwen/VNCCS/VNCCS_PoseStudioQIE2511_V1.safetensors

VNCCSのModel Managerはパッケージ直下からの相対パスを参照するため、共有フォルダに置くと「Not Installed」のまま認識されない。

GGUF量子化レベルの選定

レベルサイズ精度対象環境
Q5_010GB低い(顔のディテール甘い)VRAM節約向け
Q8_015GBバランス良い24GB VRAMならこれ
BF1638GB最高(元モデル同等)96GB VRAM向け

Q5_0だと人物の再現度が低く、BF16にすると体感で明確に違うとのこと。M1 Max 64GBならBF16も載る可能性はあるが、MPSで動くかは別問題。現実的にはQ8_0(15GB)が狙い目か。

公式2511の改善点

Qwen-Image-Edit-2511(2025年12月リリース)は、造形追随性に関する改善が入っている。

改善項目内容
Image drift軽減編集時に元画像から大きく変わってしまう問題を解決
キャラクター一貫性向上グループ写真でも人物のアイデンティティを維持
局所編集変えたい部分だけ変えて、他はそのまま

v16/v18で経験した「変化をつけると崩れる」問題に効く可能性がある。

従来のi2iとの違い

普通のimg2imgは「denoise強度」で制御するため、強くするとキャラが崩れる、弱くすると変化しない、というジレンマがあった。Qwen Image Editは自然言語で「何を変えるか」を指定できるため、変えたい部分だけピンポイントで編集できる。2511ではこの精度がさらに上がっている。

Mac M1 Maxで2511ベースを動かすには

2509ベースのv16ではなく、2511ベースをMacで動かす場合の選択肢。

方法特徴
qwen-image-mpsCLIツール、pip installで簡単、遅い(1枚数十分)
ComfyUI + GGUFワークフロー使える、Q8_0で15GB

qwen-image-mps

pip install qwen-image-mps

# 超高速モード(4ステップ)
qwen-image-mps edit -uf -i input.png -p "change pose to sitting"

ComfyUI + GGUF

cd ComfyUI/custom_nodes
git clone https://github.com/city96/ComfyUI-GGUF
pip install --upgrade gguf

モデル: unsloth/Qwen-Image-Edit-2511-GGUF

次に試すこと

  1. キャラ追随性重視のモデルを試す
    • Phr00t AIO v19: キャラ追随性が最高とされている(開発終了予定だが)
    • 公式2511 + qwen-image-mps: SFW、CLIで手軽に試せる
  2. 改善されていたら、VNCCS Pose Studioでポーズ精密制御を追加

参考リンク