#動画生成

10 件の記事

技術 2026年3月7日(土) 約5分

WAN 2.2をRTX 4060（VRAM 8GB）のComfyUIで動かす

RTX 4060 VRAM 8GBのWindows環境でWAN 2.2のI2V動画生成を試した。5B fp8は品質が厳しく、14B Rapid蒸留モデルのlowvramオフロードが現実的な解だった。

技術 2026年3月1日(日) 約13分

LTX-2とWan 2.2をM1 Max 64GBで動かした。FP8はMetal非対応、GGUF形式で回避。Wan 2.2は2秒に82分。LTX-2は公式パイプラインがMPSでNaNを出し、KSampler代替でも品質が実用に達しない。

技術 2026年2月28日(土) 約4分

Seedance 2.0のリリース直後にハリウッドのIP侵害が大量発生。Disney・Netflix・Paramountらがcease-and-desistを送付し、API公開は無期限延期、顔クローンや人物リファレンス機能も停止された。

技術 2026年2月19日(木) 約5分

Seedance 2.0のAPIは2026年2月時点で未公開。API公開後のComfyUI連携の見通しと準備事項をまとめた。

技術 2026年2月8日(日) 約6分

ByteDanceのSeedance 2.0がDreaminaで公開された。ローカルでWan 2.xやComfyUIを触ってきた視点から、クラウド動画生成サービスとの楽さの違いを考えた。

技術 2026年2月4日(水) 約3分

ComfyUI公式ワークフローとして公開されたInfiniteTalkは、音声ファイルから口パク動画を生成するリップシンク特化モデル。MOVAやVidu Q3との違い、必要なモデル構成をまとめた。

技術 2026年2月4日(水) 約3分

Tencent ARC Labが開発したAnimeGamerは、ゲームの状態遷移を理解しながらアニメスタイルの動画を生成する。汎用動画生成AIとは異なるアプローチ。

技術 2026年2月3日(火) 約3分

OpenMOSSチームが公開したMOVA-720pは、動画と音声を1回の推論で同時生成するオープンソースモデル。Vidu Q3などクローズドモデルとの違い、アーキテクチャの特徴をまとめた。

技術 2026年2月3日(火) 約3分

Ant Group傘下のRobbyantが公開したLingBot-Worldは、1枚の画像からリアルタイムでインタラクティブな映像を生成するワールドモデル。従来の動画生成AIとの違い、技術的特徴、Apple Silicon対応状況を整理した。

技術 2026年2月1日(日) 約6分

2026年1月に発表された主要な動画生成AIのアップデートを整理し、i2v（画像→動画）で実際に使えるレベルなのか、ローカルで動くモデルも含めて考察した。