技術 2026年2月4日(水) 約3分 InfiniteTalk: Wan 2.1ベースの音声駆動リップシンク ComfyUI公式ワークフローとして公開されたInfiniteTalkは、音声ファイルから口パク動画を生成するリップシンク特化モデル。MOVAやVidu Q3との違い、必要なモデル構成をまとめた。 AI 動画生成 ComfyUI リップシンク
技術 2026年2月4日(水) 約4分 UI UX Pro Max Skill:AIのUI生成を改善するスキルを過去記事と比較してみた Claude Code等のAIコーディングアシスタント向けスキル「UI UX Pro Max Skill」を、過去に書いたUI/UX改善記事と比較。自動推論 vs 人間の意図、どちらのアプローチが効くのか。 Claude Code AI UI UX
技術 2026年2月4日(水) 約3分 AnimeGamer: ゲーム状態を理解してアニメ動画を生成するAI Tencent ARC Labが開発したAnimeGamerは、ゲームの状態遷移を理解しながらアニメスタイルの動画を生成する。汎用動画生成AIとは異なるアプローチ。 AI 動画生成 ゲーム アニメ
技術 2026年2月4日(水) 約2分 Attention SinksとResidual Sinksの統一的理解 ― LLMの「外れ値」は訓練安定化の仕組みだった Transformerの謎の挙動「特定トークンへの注意集中」と「特定次元での大きな活性化」が、実は同じ機構だったという論文の解説。 LLM Transformer 論文
技術 2026年2月3日(火) 約5分 Qwen Image Editでポーズ・角度制御を改善する方法を調べた Nunchaku量子化版、VNCCS Pose Studio、公式2511の改善点を比較して、ポーズ・角度制御の改善策を探った Qwen ComfyUI 画像生成
技術 2026年2月3日(火) 約4分 M1 Max 64GBでQwen Image Edit(NSFW版)をローカル実行する Apple Silicon MacでQwen-Rapid-AIO-NSFW v16を動かし、キャラ維持しながらポーズ変更する方法 ComfyUI Qwen Apple Silicon 画像生成
技術 2026年2月3日(火) 約3分 MOVA: オープンソース初の映像・音声同時生成モデル OpenMOSSチームが公開したMOVA-720pは、動画と音声を1回の推論で同時生成するオープンソースモデル。Vidu Q3などクローズドモデルとの違い、アーキテクチャの特徴をまとめた。 AI 動画生成 音声生成 オープンソース
技術 2026年2月3日(火) 約3分 LingBot-World:Ant Groupがオープンソース化したリアルタイムワールドモデル Ant Group傘下のRobbyantが公開したLingBot-Worldは、1枚の画像からリアルタイムでインタラクティブな映像を生成するワールドモデル。従来の動画生成AIとの違い、技術的特徴、Apple Silicon対応状況を整理した。 AI 動画生成 ワールドモデル ロボティクス
技術 2026年2月3日(火) 約4分 NovelAI精密参照をローカルで再現する方法を調べた — ComfyUI + IP-Adapter NovelAIの精密参照(キャラ参照+絵柄参照)をComfyUI + IP-Adapterでローカル再現するための下調べ。セットアップ手順とパラメータ設定をまとめた。 AI 画像生成 ComfyUI IP-Adapter NovelAI Apple Silicon
技術 2026年2月3日(火) 約3分 YouTubeを無限ストレージにする系譜とmemvid 動画にファイルをエンコードして保存するプロジェクトの歴史と、QRコード+セマンティック検索という新しいアプローチを取るmemvidについて MCP 動画 ストレージ
技術 2026年2月3日(火) 約3分 planning-with-files: Manus風プラン管理をClaude Codeに導入するスキル ファイルシステムを拡張メモリとして使い、セッション間で計画・調査・進捗を引き継ぐ手法を解説 Claude Code AI