技術
約3分で読めます
BEYOND_REALITY_Z_IMAGE — Z-Image Turboベースのフォトリアル人物特化モデル
Z-Imageの派生モデルを見ていたら、ModelScopeで公開されている BEYOND_REALITY_Z_IMAGE というチェックポイントが目に留まった。フォトリアル人物に特化したファインチューンで、フィルム写真的な質感が特徴らしい。
モデル概要
| 項目 | 内容 |
|---|---|
| 作者 | Nurburgring(張弛) |
| ベース | Z-Image Turbo |
| 手法 | 人物データセットでLoRA訓練→マージ |
| ライセンス | Apache License 2.0 |
| バージョン | v1.0〜v3.0 |
| ダウンロード数 | 約3,800 |
ModelScope: Nurburgring/BEYOND_REALITY_Z_IMAGE
特徴
- 肌のテクスチャ最適化: 人物の肌質感が精緻
- フィルム写真美学: 色彩と光の表現がフィルムカメラ的
- 環境ディテール: 背景や小物の描写が細かい
- Z-Image Turboの高速性を維持: 10〜15ステップで生成可能
推奨パラメータ
| 設定 | 値 |
|---|---|
| サンプラー | Euler + Simple |
| ステップ数 | 10〜15 |
| CFG | 1〜2 |
Z-Image Turboベースなので、ステップ数が少なくても高品質な出力が得られる。CFGも低めで良い。
M1 Max 64GBで動くか
結論: 動く。
Z-Image Turboのメモリ要件
| コンポーネント | サイズ |
|---|---|
| Z-Image Turbo (BF16) | 約12GB |
| Qwen3 4B テキストエンコーダー | 約7GB |
| VAE | 数百MB |
| 合計 | 約20GB前後 |
M1 Maxの64GBユニファイドメモリなら余裕で動作する。量子化版を使えばさらに軽い。
| 量子化形式 | サイズ |
|---|---|
| BF16(フル) | 約12GB |
| FP8 | 約6GB |
| Q4_K_M (GGUF) | 約4GB |
Apple Siliconでの動作
ComfyUI + Metal対応で動作する。MLX版があればさらに最適化される可能性あり。stable-diffusion.cppを使えばGGUF量子化版を4GB VRAMでも動かせるという報告がある。
Z-Image派生モデルの位置づけ
Z-Imageシリーズは以下の構成になっている。
| モデル | 用途 |
|---|---|
| Z-Image | 基盤モデル。LoRA・ControlNet対応 |
| Z-Image-Turbo | 蒸留版。8ステップで高速生成 |
| Z-Image-Omni-Base | マルチモーダル基盤 |
| Z-Image-Edit | 画像編集特化 |
BEYOND_REALITY_Z_IMAGEはZ-Image Turboをベースに、フォトリアル人物向けのLoRAをマージしたチェックポイント。Turboの高速性を保ちながら、人物画像の品質を向上させている。
関連記事
このブログのZ-Image・画像生成AI関連記事:
- Z-Image — FLUXを超えたと言われるAlibaba発の画像生成AI
- Z-Image(造相)をRunPodで動かせるか調べた
- 【生成AI】仕事でLLM / RAG導入するので空き時間でLoRA作ってみる2025(前編)
- RTX 3060 Laptop (6GB VRAM) でLoRA学習環境を構築する