技術2026年6月28日(日)約7分DeepSeek-V4-Pro-DSparkは新モデルではなく投機的デコード用のV4-Pro派生Hugging Faceに出たDeepSeek-V4-Pro-DSparkは新しい基盤モデルではなく、V4-Proに投機的デコード(DSpark)用モジュールを足した約893GBの派生。config.jsonとDeepSpec、HFのストレージ差から中身を確認し、速度ベンチがまだ無いことまで整理した。LLMDeepSeek中華系AIMoE推論最適化オープンモデル
技術2026年4月27日(月)約6分LLaDA2.0-Uniは拡散LLMで画像理解と生成を一本化したオープンモデルInclusion AIがLLaDA2.0-Uniを公開した。16B MoEの拡散LLMを中核に、画像理解、1024px画像生成、画像編集、テキストと画像の交互生成を単一モデルで扱う。AILLM画像生成VLMMoEオープンモデル拡散モデル
技術2026年4月24日(金)約10分DeepSeek V4 Previewが1Mコンテキストで登場、V4-Pro 1.6T/V4-Flash 284BがMITで公開されV3.2比27% FLOPsを実現DeepSeekが2026年4月24日にV4 Previewを公開。V4-Pro(1.6T/49B active)とV4-Flash(284B/13B active)はどちらも1Mコンテキストに対応し、CSA+HCAハイブリッドアテンションとmHC、Muonオプティマイザで1Mトークン時のFLOPsをV3.2比27%まで削減している。Expert Mode / Instant Modeとして即日APIも更新された。LLMDeepSeek中華系AIMoEオープンモデルAIエージェント
技術2026年4月24日(金)更新約14分Tencent Hy3-previewとAnt Ling-2.6-flashが同週公開、中華系オープンMoEが295Bと104Bで別方向に走る2026年4月22日にAnt LingがLing-2.6-flash(104B/7.4B active)を、翌23日にTencent HunyuanがHy3-preview(295B/21B active)をそれぞれオープンウェイトで公開した。片やDeepSeek-V3やGLM-4.5と同じフロンティア帯を狙う重量級、片やトークン効率7倍を打ち出す高効率エージェント特化型で、同じ週に出てきた中華系MoEでも方向性がはっきり分かれている。LLM中華系AIMoEオープンモデルAIエージェントローカルLLMOpenRouter
技術2026年4月8日(水)約9分智谱AIのGLM-5.1、600回以上の反復で性能が落ちないLong-Horizonエージェントモデル智谱AI(Zhipu AI)がGLM-5.1をリリース。744BパラメータのMoEで40Bアクティブ、SWE-Bench Proで58.4%のSOTA達成。8時間・6000回超のツール呼び出しでも性能劣化しない長期タスク対応が最大の特徴。AILLM中華系AIMoEオープンモデルAIエージェント
技術2026年4月3日(金)更新約24分Google Gemma 4がE2BからA4Bまで4サイズ展開、Gemini 3由来の推論性能をApache 2.0で公開Google DeepMindがGemma 4をリリース。31B Dense、26B MoE(A4B)、E4B、E2Bの4モデルで、256Kコンテキスト、マルチモーダル入力、ツール呼び出し、140言語をサポートする。AILLMGoogleオープンモデルMoEマルチモーダルローカルLLM