技術 約3分で読めます

BEYOND_REALITY_Z_IMAGE — Z-Image Turboベースのフォトリアル人物特化モデル

Z-Imageの派生モデルを見ていたら、ModelScopeで公開されている BEYOND_REALITY_Z_IMAGE というチェックポイントが目に留まった。フォトリアル人物に特化したファインチューンで、フィルム写真的な質感が特徴らしい。

モデル概要

項目内容
作者Nurburgring(張弛)
ベースZ-Image Turbo
手法人物データセットでLoRA訓練→マージ
ライセンスApache License 2.0
バージョンv1.0〜v3.0
ダウンロード数約3,800

ModelScope: Nurburgring/BEYOND_REALITY_Z_IMAGE

特徴

  • 肌のテクスチャ最適化: 人物の肌質感が精緻
  • フィルム写真美学: 色彩と光の表現がフィルムカメラ的
  • 環境ディテール: 背景や小物の描写が細かい
  • Z-Image Turboの高速性を維持: 10〜15ステップで生成可能

推奨パラメータ

設定
サンプラーEuler + Simple
ステップ数10〜15
CFG1〜2

Z-Image Turboベースなので、ステップ数が少なくても高品質な出力が得られる。CFGも低めで良い。

M1 Max 64GBで動くか

結論: 動く。

Z-Image Turboのメモリ要件

コンポーネントサイズ
Z-Image Turbo (BF16)約12GB
Qwen3 4B テキストエンコーダー約7GB
VAE数百MB
合計約20GB前後

M1 Maxの64GBユニファイドメモリなら余裕で動作する。量子化版を使えばさらに軽い。

量子化形式サイズ
BF16(フル)約12GB
FP8約6GB
Q4_K_M (GGUF)約4GB

Apple Siliconでの動作

ComfyUI + Metal対応で動作する。MLX版があればさらに最適化される可能性あり。stable-diffusion.cppを使えばGGUF量子化版を4GB VRAMでも動かせるという報告がある。

Z-Image派生モデルの位置づけ

Z-Imageシリーズは以下の構成になっている。

モデル用途
Z-Image基盤モデル。LoRA・ControlNet対応
Z-Image-Turbo蒸留版。8ステップで高速生成
Z-Image-Omni-Baseマルチモーダル基盤
Z-Image-Edit画像編集特化

BEYOND_REALITY_Z_IMAGEはZ-Image Turboをベースに、フォトリアル人物向けのLoRAをマージしたチェックポイント。Turboの高速性を保ちながら、人物画像の品質を向上させている。

関連記事

このブログのZ-Image・画像生成AI関連記事:

参考リンク