技術 2026年3月14日(土) 約8分 CloudflareがAIアプリ向けWAFセキュリティとRFC 9457エラーレスポンスを同日リリース AI Security for AppsがGAに達し、プロンプトインジェクション・PII漏洩をWAFで遮断できるようになった。同日、AIエージェントがCloudflareエラーに遭遇する際のHTMLをJSON/Markdownで置き換えるRFC 9457対応も提供開始。 Cloudflare AI Security Prompt Injection WAF AI Agent RFC LLM
技術 2026年3月14日(土) 約8分 Claude 1Mコンテキストウィンドウが正式GA、追加料金なしで標準APIに統合 Anthropicが1MトークンのコンテキストウィンドウをGA化。長コンテキストへの追加料金なし、画像・PDF上限も100から600に拡大。MRCR v2でフロンティアモデル最高スコアを達成。 Claude Anthropic LLM AI
技術 2026年3月11日(水) 約6分 16のオープンソースRLライブラリで見えたLLM非同期訓練の設計パターン HuggingFaceが16のオープンソースRL訓練ライブラリを7つの設計軸で比較分析。同期型では生成ボトルネックでGPU利用率が60%程度に留まるが、非同期分離設計で95%以上に改善できる。 AI 機械学習 強化学習 LLM
技術 2026年3月10日(火) 約7分 インドが全工程を自前で作った初のオープンソースLLM Sarvam 30B/105B Sarvam AIがインド国内のインフラだけで事前学習からRLまで完結させた30Bと105Bのモデルを公開。22のインド指定言語対応と推論最適化が特徴。 LLM OpenSource AI MachineLearning
技術 2026年3月10日(火) 約7分 KarpathyのAutoresearchは寝てる間にAIがML実験を100回回してくれるシステム Andrej KarpathyがAutoresearchを公開。AIエージェントがGPUの上で機械学習の実験を自律実行し、寝ている間に100パターン試してくれる。ML知識ゼロでも分かるように仕組みと設計思想を解説。 AI MachineLearning LLM Agent OpenSource
技術 2026年3月6日(金) 約10分 OpenAI GPT-5.3/5.4の連続リリースとSaguaroによる推論高速化 GPT-5.3 Instantのハルシネーション削減と安全性退行、GPT-5.4のcomputer use・Tool Search・1Mトークンコンテキスト、そしてSaguaroが実現した推論5倍高速化をまとめた。 LLM OpenAI GPT 推論最適化 Speculative Decoding AI安全性 Computer Use
技術 2026年3月4日(水) 約7分 Amazon Bedrock MantleエンジンのOpenAI API互換が一般提供開始、DeepSeekやMistralで既存SDKが使える AWSのBedrock分散推論エンジンMantleがOpenAI API互換を提供開始。Chat Completions APIとResponses APIに対応し、OpenAI SDKのコードをそのままGoogle/DeepSeek/Mistral等のオープンウェイトモデルに使い回せる。 AWS Amazon Bedrock OpenAI API LLM
技術 2026年3月1日(日) 約11分 Qwen 3.5がRadeon 8060Sで全滅した原因はAMDドライバだった Qwen 3.5がROCm/Vulkanで動かない原因をCPU推論・llama-server・LM Studioで切り分けた結果、AMDドライバの更新で全て解決した。 AI LLM ローカルLLM AMD llama.cpp Ollama LM Studio 実験
技術 2026年2月28日(土) 更新 約11分 abliteratedモデルをOllamaで動かそうとして全滅した話と、結局公式版で済んだ話 huihui-aiのQwen 3.5 abliteratedは全バリアントでゴミトークンを吐いて全滅。GLM-4.7-Flash abliteratedもテンプレート崩壊で使い物にならず、最終的に公式版+thinking無効が正解だった。 AI LLM Ollama ローカルLLM AMD LM Studio Vulkan ROCm 実験
技術 2026年2月28日(土) 約16分 エンコーダーモデル+ローカルLLMでOCR誤字を自動検出・修正する LUKE/BERTのfill-maskファインチューニングから始めて、perplexityベースの誤字検出→Qwen2.5 7Bでの修正判定→不一致時エスカレーションのパイプラインに至るまでの実験ログ。VRAM 8GBのRTX 4060 Laptopで完結する構成。 自然言語処理 OCR 機械学習 Python BERT LUKE ollama LLM WSL2 NDLOCR-Lite 実験
技術 2026年2月24日(火) 約8分 Claudeの大規模不正蒸留とSWE-benchの崩壊が同時に来た Anthropicが中国AI3社によるClaude蒸留を告発し、同日OpenAIがSWE-bench Verifiedを廃止。訓練の不正と評価の欠陥が同時に露呈した2026年2月23日の出来事を整理する。 AI Security Anthropic DeepSeek Benchmark LLM OpenAI SWE-bench
技術 2026年2月22日(日) 更新 約7分 AIエージェントオーケストレーションClawsとCord Andrej KarpathyがAIエージェントの上位レイヤーとして「Claws」を命名し、June KimはMCPとSQLiteで実装したCordフレームワークで同じ問いに別の角度から答えた。単発実行エージェントから自律的な調整システムへの移行を概念と実装の両面から整理する。 AI AIエージェント Agent MCP LLM Architecture Karpathy