技術 約6分で読めます

WAI-illustrious-HSWQをWAI v17と比較、M1 Maxでfast約30秒

いけさん目次

基本情報

WAI-illustrious-HSWQ v17.0 baseは2026-06-13公開。モデルファイルは waiIllustriousHSWQ_v170Base.safetensors、SafeTensor、pruned、fp8で約4.4GB。作者は unexpectedlyprovided。Civitai上の種別はIllustriousのCheckpoint。

このモデルは、WAI-illustrious-SDXL v17.0のHSWQ FP8版を土台に、DMD2、Stabilizer IL、SPO-SDXL_4k-p_10epを混ぜた低ステップ向けのマージとして説明されている。

HSWQは、単に重みを一律でFP8へ落とす量子化とは分けて考える。名前は Hybrid Sensitivity-Weighted Quantization で、層ごとの敏感さを基準に、重要な層は保護し、影響の小さいところを強く圧縮する考え方。公開されているHSWQ実装側の説明でも、FP8 E4M3に対して感度分析と重み付きヒストグラム最適化を組み合わせる手法とされている。

狙いは、WAI v17の絵をなるべく保ったまま、FP8の軽さと低ステップ運用を取ること。手元のM1 Maxで、画質と秒数がどう出るかを実測する。

モデルカード上の推奨設定は以下。

項目fast workflowhigher quality
SamplerEuler aEuler a
Steps1015-20
CFG1.02.0-3.0
Size1024x10241024x1024以上

比較対象

ラベルモデル役割
WAI v17waiIllustriousSDXL_v170比較元。通常のWAI-illustrious-SDXL v17
HSWQ fastwaiIllustriousHSWQ_v170Baseモデルカード推奨の10step / CFG1
HSWQ qualitywaiIllustriousHSWQ_v170Base同じHSWQを20step / CFG2.5で回す

生成条件

WAI v17はこれまでのIllustrious系検証で使っている通常寄りの設定にする。HSWQはモデルカードの狙いに合わせて、10stepのfastと20stepのqualityを分ける。

項目WAI v17HSWQ fastHSWQ quality
Steps301020
CFG6.01.02.5
SamplerEuler aEuler aEuler a
SchedulerKarrasnormalnormal
Size832x1216832x1216 / 一部1024x1024832x1216
Seed424242

キャラLoRAはWAI-Illustrious向けのかなちゃんLoRAを使う。LoRA設定は strength_model 1.0 / strength_clip 0.8。

素の画風

キャラLoRAなし。金髪+白ローブ+金刺繍のプロンプトで、モデル単体の色、線、衣装の盛り方を比べる。

WAI v17
素 WAI v17
HSWQ fast
素 HSWQ fast
HSWQ quality
素 HSWQ quality

WAI v17は線が太めで、いつものWAIらしい立ち絵になる。背景は灰色で、衣装の影と金装飾は分かりやすいが、絵としてはかなり整理されている。

HSWQ fastは10step / CFG1でも衣装の金刺繍が残る。顔は少し小さく、塗りは柔らかい。いわゆる萌え絵というより、西洋人形っぽい顔と質感に寄る。WAI v17より線の主張が弱く、金髪と白衣装の色は明るい。10stepでここまで出るなら、低ステップ向けという説明はまず筋が通る。

HSWQ qualityはfastよりWAI v17に近い縦長の立ち絵になった。金装飾はかなり増え、白衣装の影も強い。ただし顔やポーズはWAI v17と同じにはならず、HSWQ側の画風として別の絵になる。これは量子化だけでなく、DMD2やStabilizer IL、SPO-SDXL_4k-p_10epを混ぜたマージの影響もあるはず。

かなちゃんLoRA

kanachan トリガーで全身とバストアップ。識別点は茶髪、向かって右のサイドポニー、アホ毛、茶目、青い髪留め、白シャツ+赤ネクタイ。

WAI v17 全身
かな全身 WAI v17
HSWQ fast 全身
かな全身 HSWQ fast
HSWQ quality 全身
かな全身 HSWQ quality
WAI v17 バスト
かなバスト WAI v17
HSWQ fast バスト
かなバスト HSWQ fast
HSWQ quality バスト
かなバスト HSWQ quality

全身では、HSWQでもLoRAのキャラ要素は残る。茶髪、向かって右のサイドポニー、アホ毛、青い髪留め、赤ネクタイはfastでもqualityでも出ている。WAI v17向けLoRAだから崩れるかと思ったが、この1枚では互換性に大きな問題は出ていない。

差は構図と顔。WAI v17は全身の収まりがよく、白シャツ、赤ネクタイ、黒ローファーが指定どおりに近い。一方で、プロンプト上は navy skirt だが、WAI v17もHSWQもスカートは赤く出ている。学習データ側に赤いスカートは入れていないので、LoRAが服色として赤を覚えているというより、プロンプト内の red necktie が近くの服要素へ回っている可能性が高い。ここはAnima系のほうが色指定を分離できていた。

HSWQ fastは少し寄り構図で、靴は茶色寄りになる。全身図では、3枚の年齢感に大きな差は出ていない。LoRAを当てたかなで比べると、HSWQのほうが顔の輪郭線や髪の束がパキッとして見える。素の画風ではWAI v17の線が太めに見えたが、LoRAではHSWQ側の線の締まりが目立つ。WAI v17の絵に戻るというより、HSWQ側のかなになる。

色合いはHSWQのほうが良い。WAI v17は少し淡くまとまるが、HSWQは肌と髪の色が明るく、赤ネクタイやスカートの色も抜けが良い。発色だけで見れば、WAI v17よりHSWQのほうが見栄えする。

バストアップはHSWQがかなり寄る。WAI v17も顔は大きいが、首元とネクタイまで入っている。HSWQ fastは顔で画面がほぼ埋まり、HSWQ qualityも同じ方向。顔、目、髪、アホ毛、サイドポニー、青い髪留めは保てているのでキャラは出ているが、構図の画面占有率はWAI v17と揃っていない。バストアップ比較では、HSWQは upper body だけだと寄りやすい。

バストアップでは、fastが一番大人っぽい。qualityは線と目の見栄えが良く、顔の線、目、髪のハイライトがはっきりしていて、かなのイラストとして見たときの出来はかなり良い。Anima系とどちらが良いかは好みが分かれるラインだが、HSWQの良いところはこのバストアップに出ている。

背景密度

喫茶店シーン。低ステップ向けモデルは人物だけなら成立しても、背景の本棚や小物が薄くなることがあるので、背景込みで比べる。

WAI v17
喫茶店 WAI v17
HSWQ fast
喫茶店 HSWQ fast
HSWQ quality
喫茶店 HSWQ quality

喫茶店はHSWQの差が一番分かりやすい。WAI v17も背景は成立していて、窓、本棚、植物、テーブル上の本とカップは出ている。ただ、絵としてはややおとなしく、人物も背景もいつものWAI v17のまとまり方になる。

HSWQ fastは10stepなのに光が強く、窓、屋外、時計、本棚、観葉植物まで情報量が出ている。人物の顔も明るく、背景込みの一枚絵としてはWAI v17より見栄えが良い。低ステップ向けという説明は、この喫茶店でかなり分かりやすい。

背景の書き込みはHSWQ qualityが一番良い。窓枠、屋外の建物、観葉植物、本棚、開いた本の密度が出ていて、線と光も締まる。fastの時点で秒数に対して十分良いが、背景込みで詰めるならqualityのほうが強い。普段使いはfast、背景や一枚絵の密度を取りたいときはqualityという分け方になる。

生成時間

M1 Max 64GBのComfyUIで、同じスクリプトから順番に回した。秒数はプロンプト投入から画像保存完了までの実測。

画像モデルSteps / CFG秒数
WAI v1730 / 6.0110.4秒
HSWQ fast10 / 1.032.1秒
HSWQ quality20 / 2.564.2秒
かな全身WAI v1730 / 6.0110.3秒
かな全身HSWQ fast10 / 1.034.3秒
かな全身HSWQ quality20 / 2.564.2秒
かなバストWAI v1730 / 6.0110.4秒
かなバストHSWQ fast10 / 1.032.1秒
かなバストHSWQ quality20 / 2.564.2秒
喫茶店WAI v1730 / 6.0108.3秒
喫茶店HSWQ fast10 / 1.028.1秒
喫茶店HSWQ quality20 / 2.564.2秒

fastはWAI v17の約3分の1、qualityでも約6割の時間で終わる。こうなると、比較の主眼は「WAI v17と完全に同じ絵か」ではなく、「この秒数でこの出力なら使うか」になる。今回の画像だけなら、HSWQ fastは十分使える。背景込みで少し詰めたいときだけqualityに上げればよさそうだ。

参考リンク