技術 2026年3月23日(月) 約7分 397Bパラメータモデルを48GB MacBookで動かすFlash-MoE Flash-MoEはQwen3.5-397B-A17BをMacBook Pro M3 Maxで4.36トークン/秒で実行するC/Metal推論エンジン。SSDからのエキスパートストリーミングと手書きMetalシェーダーで209GBのモデルを48GBのメモリ環境に収めた。 Inference MPS LLM Qwen MoE ローカルLLM
技術 2026年3月23日(月) 約14分 BERT+Qwen OCR校正パイプラインをPythonツールにした BERT perplexityスキャン→LLM判定→エスカレーションの3段パイプラインを、Win/Mac/Linux対応のPythonツールにパッケージング。インストーラーがllama-serverとGGUFモデルまで自動で落としてくる。 自然言語処理 OCR 機械学習 Python BERT LLM llama.cpp Qwen NDLOCR-Lite Gradio Ollama 実験
技術 2026年3月22日(日) 約14分 Together AIがMamba-3を発表、長文推論でTransformer比約7倍の速度と複素数値SSM 推論遅延の削減を第一目標に再設計されたMamba-3。指数台形離散化・複素数値状態・MIMO構造の3改善で、16384トークンでTransformerの約6.9倍の速度を達成した。 SSM LLM Inference Architecture
技術 2026年3月22日(日) 約5分 Compresr Context GatewayはAIエージェントのコンテキスト枯渇をどう解決するか YC出身のCompresrが開発するContext Gatewayは、AIエージェントとLLM APIの間に入るプロキシ。先読み要約・ツール出力圧縮・ツールディスカバリの3本柱でコンテキストウィンドウの浪費を防ぐ。 AI LLM Claude Code Go OSS
技術 2026年3月22日(日) 約7分 You can use the free LLM API 3,000 times a month with Sakura AI Engine Sakura Internet's "Sakura AI Engine" is an LLM inference platform compatible with OpenAI API. There is a free limit of 3,000 requests per month, and multiple models such as Kimi-K2.5 and gpt-oss-120b can be used domestically. AI LLM Sakura Internet API
技術 2026年3月21日(土) 約3分 Cursor Composer 2はKimi K2.5にコーディング特化RLを適用したモデルだった CursorがComposer 2の基盤モデルを未公表のままリリースし、API経由でKimi K2.5であることが判明。ライセンス問題に発展したが、Moonshot AIとの正式契約が確認された。 Cursor Kimi Moonshot AI 強化学習 LLM オープンウェイト
技術 2026年3月21日(土) 約8分 MoonshotAI(Kimi)がTransformerの残差接続をAttentionで置き換えるAttnResを提案、1.25倍の計算効率 Transformerの固定残差結合を深さ方向のsoftmax attentionに置き換えるAttnRes。Kimi Linear 48Bでの実証でGPQA-Diamond +7.5pt、HumanEval +3.1ptの改善。訓練オーバーヘッドは4%未満、推論は2%未満に抑えた。 AI LLM MoonshotAI Kimi Transformer 研究
技術 2026年3月18日(水) 約4分 PC操作AIが1.7倍速くなったHolotron-12Bと、コード不要でAIを自分好みに調整できるUnsloth Studio H CompanyのHolotron-12Bはメモリ効率の良い新設計で、PC操作AIの処理速度を毎秒8,900トークンに引き上げた。UnslothはAIモデルの追加学習をコード不要でできるブラウザツール「Studio」をベータ公開。 AI LLM AIエージェント Unsloth ローカルLLM
技術 2026年3月17日(火) 約3分 メリアム・ウェブスターとブリタニカがOpenAIを著作権侵害で提訴 辞書と百科事典の両老舗がOpenAIを提訴。約10万件の記事を無断でLLM学習に使用したとして著作権侵害を主張している。 OpenAI 著作権 AI LLM Law
技術 2026年3月14日(土) 約8分 CloudflareがAIアプリ向けWAFセキュリティとRFC 9457エラーレスポンスを同日リリース AI Security for AppsがGAに達し、プロンプトインジェクション・PII漏洩をWAFで遮断できるようになった。同日、AIエージェントがCloudflareエラーに遭遇する際のHTMLをJSON/Markdownで置き換えるRFC 9457対応も提供開始。 Cloudflare セキュリティ Prompt Injection WAF AIエージェント RFC LLM
技術 2026年3月14日(土) 約8分 Claude 1Mコンテキストウィンドウが正式GA、追加料金なしで標準APIに統合 Anthropicが1MトークンのコンテキストウィンドウをGA化。長コンテキストへの追加料金なし、画像・PDF上限も100から600に拡大。MRCR v2でフロンティアモデル最高スコアを達成。 Claude Anthropic LLM AI
技術 2026年3月11日(水) 約6分 16のオープンソースRLライブラリで見えたLLM非同期訓練の設計パターン HuggingFaceが16のオープンソースRL訓練ライブラリを7つの設計軸で比較分析。同期型では生成ボトルネックでGPU利用率が60%程度に留まるが、非同期分離設計で95%以上に改善できる。 AI 機械学習 強化学習 LLM