技術 2026年3月11日(水) 約6分 16のオープンソースRLライブラリで見えたLLM非同期訓練の設計パターン HuggingFaceが16のオープンソースRL訓練ライブラリを7つの設計軸で比較分析。同期型では生成ボトルネックでGPU利用率が60%程度に留まるが、非同期分離設計で95%以上に改善できる。 AI 機械学習 強化学習 LLM
技術 2026年3月10日(火) 約7分 インドが全工程を自前で作った初のオープンソースLLM Sarvam 30B/105B Sarvam AIがインド国内のインフラだけで事前学習からRLまで完結させた30Bと105Bのモデルを公開。22のインド指定言語対応と推論最適化が特徴。 LLM OSS AI MachineLearning
技術 2026年3月10日(火) 約7分 KarpathyのAutoresearchは寝てる間にAIがML実験を100回回してくれるシステム Andrej KarpathyがAutoresearchを公開。AIエージェントがGPUの上で機械学習の実験を自律実行し、寝ている間に100パターン試してくれる。ML知識ゼロでも分かるように仕組みと設計思想を解説。 AI MachineLearning LLM AIエージェント OSS
技術 2026年3月6日(金) 約10分 OpenAI GPT-5.3/5.4の連続リリースとSaguaroによる推論高速化 GPT-5.3 Instantのハルシネーション削減と安全性退行、GPT-5.4のcomputer use・Tool Search・1Mトークンコンテキスト、そしてSaguaroが実現した推論5倍高速化をまとめた。 LLM OpenAI GPT 推論最適化 Speculative Decoding AI安全性 Computer Use
技術 2026年3月4日(水) 約7分 Amazon Bedrock MantleエンジンのOpenAI API互換が一般提供開始、DeepSeekやMistralで既存SDKが使える AWSのBedrock分散推論エンジンMantleがOpenAI API互換を提供開始。Chat Completions APIとResponses APIに対応し、OpenAI SDKのコードをそのままGoogle/DeepSeek/Mistral等のオープンウェイトモデルに使い回せる。 AWS Amazon Bedrock OpenAI API LLM
技術 2026年3月1日(日) 約11分 Qwen 3.5がRadeon 8060Sで全滅した原因はAMDドライバだった Qwen 3.5がROCm/Vulkanで動かない原因をCPU推論・llama-server・LM Studioで切り分けた結果、AMDドライバの更新で全て解決した。 AI LLM ローカルLLM AMD llama.cpp Ollama LM Studio 実験
技術 2026年2月28日(土) 更新 約11分 abliteratedモデルをOllamaで動かそうとして全滅した話と、結局公式版で済んだ話 huihui-aiのQwen 3.5 abliteratedは全バリアントでゴミトークンを吐いて全滅。GLM-4.7-Flash abliteratedもテンプレート崩壊で使い物にならず、最終的に公式版+thinking無効が正解だった。 AI LLM Ollama ローカルLLM AMD LM Studio Vulkan ROCm 実験
技術 2026年2月28日(土) 約16分 エンコーダーモデル+ローカルLLMでOCR誤字を自動検出・修正する LUKE/BERTのfill-maskファインチューニングから始めて、perplexityベースの誤字検出→Qwen2.5 7Bでの修正判定→不一致時エスカレーションのパイプラインに至るまでの実験ログ。VRAM 8GBのRTX 4060 Laptopで完結する構成。 自然言語処理 OCR 機械学習 Python BERT LUKE Ollama LLM WSL2 NDLOCR-Lite 実験
技術 2026年2月24日(火) 約8分 Claudeの大規模不正蒸留とSWE-benchの崩壊が同時に来た Anthropicが中国AI3社によるClaude蒸留を告発し、同日OpenAIがSWE-bench Verifiedを廃止。訓練の不正と評価の欠陥が同時に露呈した2026年2月23日の出来事を整理する。 AI Security Anthropic DeepSeek Benchmark LLM OpenAI SWE-bench
技術 2026年2月22日(日) 更新 約7分 AIエージェントオーケストレーションClawsとCord Andrej KarpathyがAIエージェントの上位レイヤーとして「Claws」を命名し、June KimはMCPとSQLiteで実装したCordフレームワークで同じ問いに別の角度から答えた。単発実行エージェントから自律的な調整システムへの移行を概念と実装の両面から整理する。 AI AIエージェント MCP LLM Architecture Karpathy
技術 2026年2月20日(金) 更新 約11分 LLM推論を高速化するCDLMとAttention Matching KV圧縮 Together AIのConsistency DLM(最大14.5倍高速化)と、MIT・HarvardのAttention Matching KV圧縮(50倍圧縮を数秒で)。2026年2月に出た推論コスト削減の2本。 AI LLM 推論最適化 KVキャッシュ 拡散モデル
技術 2026年2月18日(水) 約3分 NVIDIA Nemotron 2 Nano 9B Japanese - 10B以下で日本語性能トップのソブリンAIモデル NVIDIAがNemotron-Nano-9B-v2-Japaneseを公開した。Nejumi Leaderboard 4の10B以下カテゴリで1位を獲得し、日本語の知識・QA・ツール呼び出しで優れた性能を示す。 NVIDIA LLM Nemotron Japanese AI