#オープンモデル

6 件の記事

技術2026年6月28日(日)約7分

DeepSeek-V4-Pro-DSparkは新モデルではなく投機的デコード用のV4-Pro派生

Hugging Faceに出たDeepSeek-V4-Pro-DSparkは新しい基盤モデルではなく、V4-Proに投機的デコード（DSpark）用モジュールを足した約893GBの派生。config.jsonとDeepSpec、HFのストレージ差から中身を確認し、速度ベンチがまだ無いことまで整理した。

LLM DeepSeek 中華系AI MoE 推論最適化オープンモデル

技術2026年4月27日(月)約6分

LLaDA2.0-Uniは拡散LLMで画像理解と生成を一本化したオープンモデル

Inclusion AIがLLaDA2.0-Uniを公開した。16B MoEの拡散LLMを中核に、画像理解、1024px画像生成、画像編集、テキストと画像の交互生成を単一モデルで扱う。

AI LLM 画像生成 VLM MoE オープンモデル拡散モデル

技術2026年4月24日(金)約10分

DeepSeek V4 Previewが1Mコンテキストで登場、V4-Pro 1.6T/V4-Flash 284BがMITで公開されV3.2比27% FLOPsを実現

DeepSeekが2026年4月24日にV4 Previewを公開。V4-Pro（1.6T/49B active）とV4-Flash（284B/13B active）はどちらも1Mコンテキストに対応し、CSA+HCAハイブリッドアテンションとmHC、Muonオプティマイザで1Mトークン時のFLOPsをV3.2比27%まで削減している。Expert Mode / Instant Modeとして即日APIも更新された。

LLM DeepSeek 中華系AI MoE オープンモデル AIエージェント

技術2026年4月24日(金)更新約14分

Tencent Hy3-previewとAnt Ling-2.6-flashが同週公開、中華系オープンMoEが295Bと104Bで別方向に走る

2026年4月22日にAnt LingがLing-2.6-flash（104B/7.4B active）を、翌23日にTencent HunyuanがHy3-preview（295B/21B active）をそれぞれオープンウェイトで公開した。片やDeepSeek-V3やGLM-4.5と同じフロンティア帯を狙う重量級、片やトークン効率7倍を打ち出す高効率エージェント特化型で、同じ週に出てきた中華系MoEでも方向性がはっきり分かれている。

LLM 中華系AI MoE オープンモデル AIエージェントローカルLLM OpenRouter

技術2026年4月8日(水)約9分

智谱AIのGLM-5.1、600回以上の反復で性能が落ちないLong-Horizonエージェントモデル

智谱AI（Zhipu AI）がGLM-5.1をリリース。744BパラメータのMoEで40Bアクティブ、SWE-Bench Proで58.4%のSOTA達成。8時間・6000回超のツール呼び出しでも性能劣化しない長期タスク対応が最大の特徴。

AI LLM 中華系AI MoE オープンモデル AIエージェント

技術2026年4月3日(金)更新約24分

Google Gemma 4がE2BからA4Bまで4サイズ展開、Gemini 3由来の推論性能をApache 2.0で公開

Google DeepMindがGemma 4をリリース。31B Dense、26B MoE（A4B）、E4B、E2Bの4モデルで、256Kコンテキスト、マルチモーダル入力、ツール呼び出し、140言語をサポートする。

AI LLM Google オープンモデル MoE マルチモーダルローカルLLM