技術 2026年3月18日(水) 約4分 PC操作AIが1.7倍速くなったHolotron-12Bと、コード不要でAIを自分好みに調整できるUnsloth Studio H CompanyのHolotron-12Bはメモリ効率の良い新設計で、PC操作AIの処理速度を毎秒8,900トークンに引き上げた。UnslothはAIモデルの追加学習をコード不要でできるブラウザツール「Studio」をベータ公開。 AI LLM Agent Unsloth ローカルLLM
技術 2026年3月17日(火) 約3分 メリアム・ウェブスターとブリタニカがOpenAIを著作権侵害で提訴 辞書と百科事典の両老舗がOpenAIを提訴。約10万件の記事を無断でLLM学習に使用したとして著作権侵害を主張している。 OpenAI 著作権 AI LLM Law
技術 2026年3月14日(土) 約8分 CloudflareがAIアプリ向けWAFセキュリティとRFC 9457エラーレスポンスを同日リリース AI Security for AppsがGAに達し、プロンプトインジェクション・PII漏洩をWAFで遮断できるようになった。同日、AIエージェントがCloudflareエラーに遭遇する際のHTMLをJSON/Markdownで置き換えるRFC 9457対応も提供開始。 Cloudflare AI Security Prompt Injection WAF AI Agent RFC LLM
技術 2026年3月14日(土) 約8分 Claude 1Mコンテキストウィンドウが正式GA、追加料金なしで標準APIに統合 Anthropicが1MトークンのコンテキストウィンドウをGA化。長コンテキストへの追加料金なし、画像・PDF上限も100から600に拡大。MRCR v2でフロンティアモデル最高スコアを達成。 Claude Anthropic LLM AI
技術 2026年3月11日(水) 約6分 16のオープンソースRLライブラリで見えたLLM非同期訓練の設計パターン HuggingFaceが16のオープンソースRL訓練ライブラリを7つの設計軸で比較分析。同期型では生成ボトルネックでGPU利用率が60%程度に留まるが、非同期分離設計で95%以上に改善できる。 AI 機械学習 強化学習 LLM
技術 2026年3月10日(火) 約7分 インドが全工程を自前で作った初のオープンソースLLM Sarvam 30B/105B Sarvam AIがインド国内のインフラだけで事前学習からRLまで完結させた30Bと105Bのモデルを公開。22のインド指定言語対応と推論最適化が特徴。 LLM OpenSource AI MachineLearning
技術 2026年3月10日(火) 約7分 KarpathyのAutoresearchは寝てる間にAIがML実験を100回回してくれるシステム Andrej KarpathyがAutoresearchを公開。AIエージェントがGPUの上で機械学習の実験を自律実行し、寝ている間に100パターン試してくれる。ML知識ゼロでも分かるように仕組みと設計思想を解説。 AI MachineLearning LLM Agent OpenSource
技術 2026年3月6日(金) 約10分 OpenAI GPT-5.3/5.4の連続リリースとSaguaroによる推論高速化 GPT-5.3 Instantのハルシネーション削減と安全性退行、GPT-5.4のcomputer use・Tool Search・1Mトークンコンテキスト、そしてSaguaroが実現した推論5倍高速化をまとめた。 LLM OpenAI GPT 推論最適化 Speculative Decoding AI安全性 Computer Use
技術 2026年3月4日(水) 約7分 Amazon Bedrock MantleエンジンのOpenAI API互換が一般提供開始、DeepSeekやMistralで既存SDKが使える AWSのBedrock分散推論エンジンMantleがOpenAI API互換を提供開始。Chat Completions APIとResponses APIに対応し、OpenAI SDKのコードをそのままGoogle/DeepSeek/Mistral等のオープンウェイトモデルに使い回せる。 AWS Amazon Bedrock OpenAI API LLM
技術 2026年3月1日(日) 約11分 Qwen 3.5がRadeon 8060Sで全滅した原因はAMDドライバだった Qwen 3.5がROCm/Vulkanで動かない原因をCPU推論・llama-server・LM Studioで切り分けた結果、AMDドライバの更新で全て解決した。 AI LLM ローカルLLM AMD llama.cpp Ollama LM Studio 実験
技術 2026年2月28日(土) 更新 約11分 abliteratedモデルをOllamaで動かそうとして全滅した話と、結局公式版で済んだ話 huihui-aiのQwen 3.5 abliteratedは全バリアントでゴミトークンを吐いて全滅。GLM-4.7-Flash abliteratedもテンプレート崩壊で使い物にならず、最終的に公式版+thinking無効が正解だった。 AI LLM Ollama ローカルLLM AMD LM Studio Vulkan ROCm 実験
技術 2026年2月28日(土) 約16分 エンコーダーモデル+ローカルLLMでOCR誤字を自動検出・修正する LUKE/BERTのfill-maskファインチューニングから始めて、perplexityベースの誤字検出→Qwen2.5 7Bでの修正判定→不一致時エスカレーションのパイプラインに至るまでの実験ログ。VRAM 8GBのRTX 4060 Laptopで完結する構成。 自然言語処理 OCR 機械学習 Python BERT LUKE ollama LLM WSL2 NDLOCR-Lite 実験