#LLM

38 件の記事

技術 2026年3月18日(水) 約4分

PC操作AIが1.7倍速くなったHolotron-12Bと、コード不要でAIを自分好みに調整できるUnsloth Studio

H CompanyのHolotron-12Bはメモリ効率の良い新設計で、PC操作AIの処理速度を毎秒8,900トークンに引き上げた。UnslothはAIモデルの追加学習をコード不要でできるブラウザツール「Studio」をベータ公開。

AI LLM Agent Unsloth ローカルLLM

技術 2026年3月17日(火) 約3分

メリアム・ウェブスターとブリタニカがOpenAIを著作権侵害で提訴

辞書と百科事典の両老舗がOpenAIを提訴。約10万件の記事を無断でLLM学習に使用したとして著作権侵害を主張している。

OpenAI 著作権 AI LLM Law

技術 2026年3月14日(土) 約8分

CloudflareがAIアプリ向けWAFセキュリティとRFC 9457エラーレスポンスを同日リリース

AI Security for AppsがGAに達し、プロンプトインジェクション・PII漏洩をWAFで遮断できるようになった。同日、AIエージェントがCloudflareエラーに遭遇する際のHTMLをJSON/Markdownで置き換えるRFC 9457対応も提供開始。

Cloudflare AI Security Prompt Injection WAF AI Agent RFC LLM

技術 2026年3月14日(土) 約8分

Claude 1Mコンテキストウィンドウが正式GA、追加料金なしで標準APIに統合

Anthropicが1MトークンのコンテキストウィンドウをGA化。長コンテキストへの追加料金なし、画像・PDF上限も100から600に拡大。MRCR v2でフロンティアモデル最高スコアを達成。

Claude Anthropic LLM AI

技術 2026年3月11日(水) 約6分

16のオープンソースRLライブラリで見えたLLM非同期訓練の設計パターン

HuggingFaceが16のオープンソースRL訓練ライブラリを7つの設計軸で比較分析。同期型では生成ボトルネックでGPU利用率が60%程度に留まるが、非同期分離設計で95%以上に改善できる。

AI 機械学習強化学習 LLM

技術 2026年3月10日(火) 約7分

インドが全工程を自前で作った初のオープンソースLLM Sarvam 30B/105B

Sarvam AIがインド国内のインフラだけで事前学習からRLまで完結させた30Bと105Bのモデルを公開。22のインド指定言語対応と推論最適化が特徴。

LLM OpenSource AI MachineLearning

技術 2026年3月10日(火) 約7分

KarpathyのAutoresearchは寝てる間にAIがML実験を100回回してくれるシステム

Andrej KarpathyがAutoresearchを公開。AIエージェントがGPUの上で機械学習の実験を自律実行し、寝ている間に100パターン試してくれる。ML知識ゼロでも分かるように仕組みと設計思想を解説。

AI MachineLearning LLM Agent OpenSource

技術 2026年3月6日(金) 約10分

OpenAI GPT-5.3/5.4の連続リリースとSaguaroによる推論高速化

GPT-5.3 Instantのハルシネーション削減と安全性退行、GPT-5.4のcomputer use・Tool Search・1Mトークンコンテキスト、そしてSaguaroが実現した推論5倍高速化をまとめた。

LLM OpenAI GPT 推論最適化 Speculative Decoding AI安全性 Computer Use

技術 2026年3月4日(水) 約7分

Amazon Bedrock MantleエンジンのOpenAI API互換が一般提供開始、DeepSeekやMistralで既存SDKが使える

AWSのBedrock分散推論エンジンMantleがOpenAI API互換を提供開始。Chat Completions APIとResponses APIに対応し、OpenAI SDKのコードをそのままGoogle/DeepSeek/Mistral等のオープンウェイトモデルに使い回せる。

AWS Amazon Bedrock OpenAI API LLM

技術 2026年3月1日(日) 約11分

Qwen 3.5がRadeon 8060Sで全滅した原因はAMDドライバだった

Qwen 3.5がROCm/Vulkanで動かない原因をCPU推論・llama-server・LM Studioで切り分けた結果、AMDドライバの更新で全て解決した。

AI LLM ローカルLLM AMD llama.cpp Ollama LM Studio 実験

技術 2026年2月28日(土) 更新約11分

abliteratedモデルをOllamaで動かそうとして全滅した話と、結局公式版で済んだ話

huihui-aiのQwen 3.5 abliteratedは全バリアントでゴミトークンを吐いて全滅。GLM-4.7-Flash abliteratedもテンプレート崩壊で使い物にならず、最終的に公式版+thinking無効が正解だった。

AI LLM Ollama ローカルLLM AMD LM Studio Vulkan ROCm 実験

技術 2026年2月28日(土) 約16分

エンコーダーモデル+ローカルLLMでOCR誤字を自動検出・修正する

LUKE/BERTのfill-maskファインチューニングから始めて、perplexityベースの誤字検出→Qwen2.5 7Bでの修正判定→不一致時エスカレーションのパイプラインに至るまでの実験ログ。VRAM 8GBのRTX 4060 Laptopで完結する構成。

自然言語処理 OCR 機械学習 Python BERT LUKE ollama LLM WSL2 NDLOCR-Lite 実験