技術 2026年2月20日(金) 更新 約11分 LLM推論を高速化するCDLMとAttention Matching KV圧縮 Together AIのConsistency DLM(最大14.5倍高速化)と、MIT・HarvardのAttention Matching KV圧縮(50倍圧縮を数秒で)。2026年2月に出た推論コスト削減の2本。 AI LLM 推論最適化 KVキャッシュ 拡散モデル
技術 2026年2月18日(水) 約3分 NVIDIA Nemotron 2 Nano 9B Japanese - 10B以下で日本語性能トップのソブリンAIモデル NVIDIAがNemotron-Nano-9B-v2-Japaneseを公開した。Nejumi Leaderboard 4の10B以下カテゴリで1位を獲得し、日本語の知識・QA・ツール呼び出しで優れた性能を示す。 NVIDIA LLM Nemotron Japanese AI
技術 2026年2月18日(水) 約3分 Claude Sonnet 4.6リリース - コーディング性能でOpus 4.5を超える場面も Anthropicが中間サイズモデルClaude Sonnet 4.6を発表。Claude Codeでの評価ではユーザーの70%がSonnet 4.5より選好し、Opus 4.5との比較でも59%が選好するという結果が出ている。価格は据え置き。 Claude Anthropic LLM Claude Code
技術 2026年2月15日(日) 約5分 ローカルLLMをVPN経由で外部API化する Tailscale VPNとConoHa VPSを使って、ローカルLLMをインターネットからAPI経由で呼び出せるようにした構成と手順。 AI LLM Tailscale VPN VPS 実験
技術 2026年2月15日(日) 更新 約5分 Strix HaloのVRAM・メモリ配分を攻略する GMKtec EVO-X2(Strix Halo)でローカルLLMを動かす際のVRAM/メインメモリ配分問題と解決策。VRAM 8GBでも29.6GBモデルが動いた実証付き。 AI LLM メモリ最適化 AMD LM Studio 実験
技術 2026年2月15日(日) 更新 約5分 EVO-X2でローカルLLM環境を構築した GMKtec EVO-X2(Strix Halo)でNSFW対応のローカルLLMを構築した記録。LM StudioとMS3.2-24B-Magnum-Diamondで約11 tokens/sのGPU推論を実現するまで。 AI LLM ローカルLLM LM Studio AMD 実験
技術 2026年2月12日(木) 約7分 MioTTS - コーデックから自作した軽量LLMベースTTS Aratakoが公開したMioTTS。独自コーデックMioCodecからフルスクラッチ開発された0.1B〜2.6Bの日英対応TTSモデル群。llama.cppやOllamaでそのまま動く設計が特徴的。 AI TTS 音声合成 オープンソース LLM
技術 2026年2月8日(日) 約5分 LFM2.5 — Transformerでもない、Mambaでもないハイブリッドアーキテクチャ Liquid AIのLFM2.5は、短距離畳み込みとAttentionのハイブリッドで、SSMを使わずにエッジ最適化を実現した。アーキテクチャの仕組み、ベンチマーク、コミュニティ活用例をまとめた。 AI LLM エッジAI アーキテクチャ
技術 2026年2月7日(土) 約6分 Qwen3-TTS - pip一発で使えるオープンソース音声合成 Alibaba Qwenチームが公開したQwen3-TTSの技術解説。pip install一発でセットアップ完了、3秒のボイスクローン、自然言語での声デザイン、日本語含む10言語対応。Apache 2.0ライセンス。 AI TTS 音声合成 オープンソース LLM
技術 2026年2月6日(金) 約6分 Qwen3-Omni: 3BアクティブのMoEでテキスト・画像・音声・動画を統合処理するオムニモーダルモデル Alibabaが公開したQwen3-Omni-30B-A3Bの技術解説。30Bパラメータ中3Bのみアクティベートするオムニモーダルモデルで、テキスト・画像・音声・動画の入力から音声付きで応答する。Thinker-Talkerアーキテクチャ、ベンチマーク、Qwen3 MoEファミリーの全体像を整理した。 AI LLM オープンソース マルチモーダル 音声AI
技術 2026年2月5日(木) 約4分 UI-TARS-1.5-7B: GUIグラウンディングでSOTAを達成したVision AIエージェント ByteDanceが公開したUI-TARS-1.5-7Bの技術解説。スクリーンショットからGUI要素を特定する精度でOpenAI CUAやClaude 3.7を大幅に上回る。デスクトップアプリも提供され、ローカルで動作可能。 AI LLM エージェント オープンソース
技術 2026年2月4日(水) 約5分 Qwen3-Coder-Next: 3Bアクティブパラメータでローカル動作するコーディングエージェント Alibabaが公開したQwen3-Coder-Nextの技術解説。80Bパラメータながら3Bのみアクティベートする超効率MoEで、RTX 4090単体でも動作。SWE-Bench 70%超えの実力をローカルで。 AI LLM オープンソース エージェント