技術 2026年2月10日(火) 約3分 ActionMesh - 動画からアニメーション付き3Dメッシュを生成するMeta AIのモデル Meta AI Researchが公開したActionMeshを調査。動画を入力するとBlenderやUnityで使える.glb形式のアニメーション付き3Dメッシュが出力される。入力制限や実行環境、AI動画生成との組み合わせなど実用面を整理した。 AI 3D Blender
技術 2026年2月9日(月) 約6分 Claude Code ベストプラクティス集リポジトリの紹介と実践ガイド GitHub で1,500スターを超えた claude-code-best-practice リポジトリを深掘り。CLAUDE.md の書き方、Command→Agent→Skills の3層アーキテクチャ、Hooks による通知、RPI ワークフローなど、開発現場で使えるノウハウを整理した。 Claude Code AI 開発ツール
技術 2026年2月8日(日) 約5分 LFM2.5 — Transformerでもない、Mambaでもないハイブリッドアーキテクチャ Liquid AIのLFM2.5は、短距離畳み込みとAttentionのハイブリッドで、SSMを使わずにエッジ最適化を実現した。アーキテクチャの仕組み、ベンチマーク、コミュニティ活用例をまとめた。 AI LLM エッジAI アーキテクチャ
技術 2026年2月8日(日) 約6分 Seedance 2.0が出たので、ローカル動画生成とクラウドの「楽さ」を比べてみる ByteDanceのSeedance 2.0がDreaminaで公開された。ローカルでWan 2.xやComfyUIを触ってきた視点から、クラウド動画生成サービスとの楽さの違いを考えた。 AI 動画生成 Seedance
技術 2026年2月7日(土) 約6分 Qwen3-TTS - pip一発で使えるオープンソース音声合成 Alibaba Qwenチームが公開したQwen3-TTSの技術解説。pip install一発でセットアップ完了、3秒のボイスクローン、自然言語での声デザイン、日本語含む10言語対応。Apache 2.0ライセンス。 AI TTS 音声合成 オープンソース LLM
技術 2026年2月6日(金) 約6分 UltraFlux-v1 — FLUX.1-devベースのネイティブ4K画像生成モデル FLUX.1-devを4K生成に特化させたUltraFlux-v1の技術詳細。Z-ImageやFLUX.2 Kleinとのアプローチの違い、独自のRoPE拡張やVAE改良、実用面での注意点をまとめた。 AI 画像生成 FLUX 4K
技術 2026年2月6日(金) 約6分 Qwen3-Omni: 3BアクティブのMoEでテキスト・画像・音声・動画を統合処理するオムニモーダルモデル Alibabaが公開したQwen3-Omni-30B-A3Bの技術解説。30Bパラメータ中3Bのみアクティベートするオムニモーダルモデルで、テキスト・画像・音声・動画の入力から音声付きで応答する。Thinker-Talkerアーキテクチャ、ベンチマーク、Qwen3 MoEファミリーの全体像を整理した。 AI LLM オープンソース マルチモーダル 音声AI
技術 2026年2月5日(木) 約4分 UI-TARS-1.5-7B: GUIグラウンディングでSOTAを達成したVision AIエージェント ByteDanceが公開したUI-TARS-1.5-7Bの技術解説。スクリーンショットからGUI要素を特定する精度でOpenAI CUAやClaude 3.7を大幅に上回る。デスクトップアプリも提供され、ローカルで動作可能。 AI LLM エージェント オープンソース
技術 2026年2月4日(水) 約5分 Qwen3-Coder-Next: 3Bアクティブパラメータでローカル動作するコーディングエージェント Alibabaが公開したQwen3-Coder-Nextの技術解説。80Bパラメータながら3Bのみアクティベートする超効率MoEで、RTX 4090単体でも動作。SWE-Bench 70%超えの実力をローカルで。 AI LLM オープンソース エージェント
技術 2026年2月4日(水) 約3分 ACE-Step 1.5:音楽生成AIがアーキテクチャごと刷新された ACE-Step V1.5がリリースされた。LM+DiTのハイブリッド構成、50言語対応、4GB VRAMで動作など、V1.0から大幅に進化している。 AI 音楽生成 ローカルAI
技術 2026年2月4日(水) 約3分 InfiniteTalk: Wan 2.1ベースの音声駆動リップシンク ComfyUI公式ワークフローとして公開されたInfiniteTalkは、音声ファイルから口パク動画を生成するリップシンク特化モデル。MOVAやVidu Q3との違い、必要なモデル構成をまとめた。 AI 動画生成 ComfyUI リップシンク
技術 2026年2月4日(水) 約4分 UI UX Pro Max Skill:AIのUI生成を改善するスキルを過去記事と比較してみた Claude Code等のAIコーディングアシスタント向けスキル「UI UX Pro Max Skill」を、過去に書いたUI/UX改善記事と比較。自動推論 vs 人間の意図、どちらのアプローチが効くのか。 Claude Code AI UI UX