技術 2026年3月7日(土) 約5分 WAN 2.2をRTX 4060(VRAM 8GB)のComfyUIで動かす RTX 4060 VRAM 8GBのWindows環境でWAN 2.2のI2V動画生成を試した。5B fp8は品質が厳しく、14B Rapid蒸留モデルのlowvramオフロードが現実的な解だった。 AI 動画生成 Wan ComfyUI Windows CUDA 実験
技術 2026年3月1日(日) 約13分 LTX-2とWan 2.2をM1 Max 64GBで動かせるのか調べて動かした LTX-2とWan 2.2をM1 Max 64GBで動かした。FP8はMetal非対応、GGUF形式で回避。Wan 2.2は2秒に82分。LTX-2は公式パイプラインがMPSでNaNを出し、KSampler代替でも品質が実用に達しない。 AI 動画生成 LTX-2 Wan Apple Silicon 実験
技術 2026年2月28日(土) 約4分 Seedance 2.0がハリウッドに著作権で詰められてAPI無期限停止になった Seedance 2.0のリリース直後にハリウッドのIP侵害が大量発生。Disney・Netflix・Paramountらがcease-and-desistを送付し、API公開は無期限延期、顔クローンや人物リファレンス機能も停止された。 AI 動画生成 Seedance 著作権
技術 2026年2月19日(木) 約5分 Seedance 2.0 APIとComfyUI連携の現状 Seedance 2.0のAPIは2026年2月時点で未公開。API公開後のComfyUI連携の見通しと準備事項をまとめた。 AI 動画生成 ComfyUI API Seedance
技術 2026年2月8日(日) 約6分 Seedance 2.0が出たので、ローカル動画生成とクラウドの「楽さ」を比べてみる ByteDanceのSeedance 2.0がDreaminaで公開された。ローカルでWan 2.xやComfyUIを触ってきた視点から、クラウド動画生成サービスとの楽さの違いを考えた。 AI 動画生成 Seedance
技術 2026年2月4日(水) 約3分 InfiniteTalk: Wan 2.1ベースの音声駆動リップシンク ComfyUI公式ワークフローとして公開されたInfiniteTalkは、音声ファイルから口パク動画を生成するリップシンク特化モデル。MOVAやVidu Q3との違い、必要なモデル構成をまとめた。 AI 動画生成 ComfyUI リップシンク
技術 2026年2月4日(水) 約3分 AnimeGamer: ゲーム状態を理解してアニメ動画を生成するAI Tencent ARC Labが開発したAnimeGamerは、ゲームの状態遷移を理解しながらアニメスタイルの動画を生成する。汎用動画生成AIとは異なるアプローチ。 AI 動画生成 ゲーム アニメ
技術 2026年2月3日(火) 約3分 MOVA: オープンソース初の映像・音声同時生成モデル OpenMOSSチームが公開したMOVA-720pは、動画と音声を1回の推論で同時生成するオープンソースモデル。Vidu Q3などクローズドモデルとの違い、アーキテクチャの特徴をまとめた。 AI 動画生成 音声生成 オープンソース
技術 2026年2月3日(火) 約3分 LingBot-World:Ant Groupがオープンソース化したリアルタイムワールドモデル Ant Group傘下のRobbyantが公開したLingBot-Worldは、1枚の画像からリアルタイムでインタラクティブな映像を生成するワールドモデル。従来の動画生成AIとの違い、技術的特徴、Apple Silicon対応状況を整理した。 AI 動画生成 ワールドモデル ロボティクス
技術 2026年2月1日(日) 約6分 動画生成AI 2026年1月のアップデートまとめとi2vの現在地 2026年1月に発表された主要な動画生成AIのアップデートを整理し、i2v(画像→動画)で実際に使えるレベルなのか、ローカルで動くモデルも含めて考察した。 AI 動画生成 i2v