ComfyUI公式が出したAIアップスケーリング完全ガイドを読み解く
ComfyUIがコミュニティで2番目に要望の多かった機能として、AIアップスケーリングの包括的なガイドを公開した。数週間のテストと統合を経て、主要なアップスケーリング手法がすべてComfyUI上で利用可能になったとのこと。
10のユースケースと20のワークフローが紹介されていて、かなり実用的な内容だったのでまとめておく。
元記事: The Complete AI Upscaling Handbook: All in ComfyUI
なぜ今アップスケーリングなのか
ガイドが挙げている理由はこのあたり。
- 業界要件: VFX・映画・マーケティング・Eコマース・ゲーム・デザインなどで4K/8Kの納品が当たり前になってきている
- リフレーミング: アスペクト比変更やクロップ時に、解像度に余裕がないと画質が落ちる
- AI生成物の品質問題: 現状のAI生成画像はほとんどが480〜720pで、エッジ・テクスチャ・顔・手などピクセルレベルでは本番品質に達していない
- コスト・時間の効率化: 小さく生成して最後にアップスケールするのが、予算や時間に制約のあるパイプラインの定石
個人的には、マシンに載るサイズで直接生成していたからアップスケールの必要性を感じていなかった。ただ「生成→修正→アップスケール→納品」というパイプラインの考え方や、創造的アップスケールによる質感追加は理解できる。特に動画では「小さく速く生成→後から拡大」の恩恵が大きそう。
保守的アップスケール vs 創造的アップスケール
このガイドで一番重要な概念がこの2つの区別。
保守的アップスケール(Conservative)は元の画像に忠実に解像度だけを上げる。従来の超解像に近いアプローチで、商品写真や建築物など「変えてはいけない」用途に向いている。
創造的アップスケール(Creative)はAIが存在しなかったディテールを補完・再構築する。拡散モデルの登場で可能になったアプローチで、肌の質感追加や風景の雰囲気向上など「より良くしたい」用途に使える。
どちらが優れているという話ではなく、用途によって使い分けるのがポイント。
画像アップスケール: 用途別ガイド
ポートレート・肌の質感
リアルな肌のディテール(毛穴、自然な肌の凹凸)を追加しつつ、キャラクターの一貫性を保つのが重要。この分野では Magnific Image Skin Enhancer が他を圧倒しているとのこと。AI生成画像特有のプラスチック感のある肌を自然にするのに特化している。
商品写真
素材感、ラベルのエッジ、小さな文字を忠実に再現する必要があるため、保守的なモデルが必須。推奨は HitPaw、Magnific Precise、WaveSpeed SeedVR2、Nano Banana Pro。
風景・環境
ここはニーズ次第。雰囲気やディテールを盛りたいなら創造的モデル、建物の正確さを維持したいなら保守的モデル。入力画像にアーティファクトがある場合、創造的モデルなら再構築できる可能性があるが、保守的モデルではそのまま残る。
イラスト・スタイライズドアート
独特なスタイルを持つ入力なら保守的モデルを選ぶべき。創造的モデルはディテールを足しすぎてスタイルが崩れることがある。逆にディテールの余地がある入力なら、創造的モデルがスタイルを強化してくれる。Magnific CreativeやTopaz Image Enhanceの「creativity」パラメータで調整するのが良い。
AI生成画像の修正
指の本数、アーティファクト、解剖学的な不正確さなど、典型的なAI画像の問題をアップスケールで直そうとするのは非推奨。創造的アップスケールで直ることもあるが、直らないことも多い。アップスケール前に画像編集モデルや従来ツールで修正するのがベストプラクティス。
画像アップスケール速度(1K→4K)
| モデル | 処理時間 |
|---|---|
| Magnific Precise | 約40秒 |
| WaveSpeed SeedVR2 | 約40秒 |
| Magnific Creative | 約50秒 |
| Magnific Skin Enhancer | 約60秒 |
| HitPaw | 約60秒 |
| Nano Banana Pro | 約80秒 |
| Topaz Image Enhance | 約100秒 |
動画アップスケール: 用途別ガイド
品質モード
SeedVR2 と HitPaw が最も正確な結果を出す。画質が高く、キャラクターの一貫性も優秀。Topazも効果的だが、やや創造的に寄る場合がある。シネマティックな映像でスタイライズされた見た目が許容できるなら選択肢に入る。
速度モード
FlashVSR が速度重視の場合に非常に優秀。720p→1080pが10秒の動画に対して約41秒。HitPawも比較的高速。TopazはFastモードとCreativeモードのレンダリング速度がほぼ同じなので、速度を犠牲にせずCreativeモードを使うのが推奨。
AI動画の修正
Topaz Astra Creative が非常に滑らかで視覚的に一貫した出力を生成する。AI生成動画の修復に強い。ワークフローのコツとして、まず修正パスを走らせてから1080pにアップスケールし、さらに段階的に4Kにアップスケールするのが良い。
アーカイブ修復
SeedVR2 が特に印象的。元のフッテージの構造とディテールを保持しつつクリアにする。人工的で過度な特徴の追加を避ける。
CGI・3Dレンダー
Topaz、SeedVR2、HitPawのいずれも優秀。クリーンでシャープな結果を出し、合成画像に重要なエッジのクリスプさを維持する。
動画アップスケール速度(10秒720pクリップ)
| モデル | 解像度 | 処理時間 |
|---|---|---|
| FlashVSR(ローカル) | 1080p | 約41秒 |
| FlashVSR(ローカル) | 4K | 約52秒 |
| HitPaw | 2K | 約80秒 |
| HitPaw | 4K | 約175秒 |
| SeedVR2(ローカル) | 1080p | 約312秒 |
| Topaz Astra | 1080p | 約374秒 |
| Topaz Astra | 4K | 約560秒 |
| Wan2.2 Upscale(ローカル) | — | 約1100秒(2秒入力) |
ハードウェア: NVIDIA GeForce RTX 5090
ComfyUIで使えるワークフロー一覧
全モデルとワークフローはComfy Cloud上ですぐに利用可能。ローカルでもダウンロードしてセットアップできる。
画像アップスケール:
- SeedVR2(オープンソース)
- Topaz Image Enhance: Creative / Landscape / Illustration
- Magnific: Skin Enhancer
- HitPaw: Creative / Creative Portrait
- Recraft: Creative / Crisp
- Nano Banana Pro: Portrait / Product / Styled Art
- 従来の非AIアップスケーリング(オープンソース)
動画アップスケール:
- Fast GAN(オープンソース): 従来型
- SeedVR2(オープンソース / WaveSpeed API): 保守的
- FlashVSR(WaveSpeed API): 保守的
- Wan2.2 Upscale(オープンソース): 創造的
- Topaz Astra: 創造的
- HitPaw: オールインワン