#機械学習

16 件の記事

技術 2026年4月24日(金) 約8分

TRACERはLLM分類APIのログから代理モデルを学習してparity gateで置き換える

arXivに出たTRACERは、LLM分類エンドポイントの入出力ログをそのまま訓練データに転用し、parity gateで合格した領域だけ軽量な代理モデルに差し替えて推論コストを下げる仕組みだ。77クラスの意図分類で83〜100%、150クラスでは100%のトラフィックを代理モデルが吸収できることを示した一方、NLIタスクでは「配備不可」と正しく拒否した挙動が面白い。

AI LLM 機械学習論文推論最適化

技術 2026年4月23日(木) 約6分

AIの記事を読むための数学入門、全5本シリーズのまとめ

AIやLLMの記事に出てくる数学記号を『解けるのではなく読めるように』整理した全5本シリーズのハブ。数式・ベクトル/行列・確率統計・微分・勾配降下と逆伝播を、どの順番で読むとラクかも添えて並べる。

AI LLM 機械学習数式入門

技術 2026年4月23日(木) 約26分

AIの学習を動かしている勾配降下と逆伝播、ここだけ読めれば怖くない

勾配降下、SGD・Adam、逆伝播、勾配消失・残差接続、学習率スケジュールあたりを「何をまとめてやっているか」の視点で整理。解けるようになるのではなく、学習ログやモデルカードの数字を読めるようになることが目的。

AI LLM 機械学習数式入門

技術 2026年4月23日(木) 約21分

AIの記事でよく出る微分、ここだけ読めれば怖くない

AIやLLMの記事に出てくる微分まわりの記号を、解けるようになるためではなく読めるようになるために絞って整理。d/dx、e、連鎖律、偏微分、勾配までを「何をやっているか」の視点で読む。

AI LLM 機械学習数式入門

技術 2026年4月22日(水) 約22分

AIの記事でよく出る確率と統計、ここだけ読めれば怖くない

AIやLLMの記事に出てくる確率・統計まわりの記号を、解けるようになるためではなく読めるようになるために絞って整理。条件付き確率、交差エントロピー、パープレキシティ、temperatureあたりまでを「何をまとめてやっているか」の視点で読む。

AI LLM 機械学習数式入門

技術 2026年4月22日(水) 約17分

AIの記事でよく出るベクトルと行列、ここだけ読めれば怖くない

AIやLLMの記事に出てくるベクトルと行列を、計算できるようになるためではなく読めるようになるために絞って整理。内積と行列積は拾い、行列式や固有値は省略する。

AI LLM 機械学習数式入門

技術 2026年4月21日(火) 約10分

AIの記事でよく見る数式、ここだけ読めば怖くない

AIやLLM、画像生成の解説で見かける数式を、解けるようになるためではなく読めるようになるために整理。重み付きの足し算、S字カーブ、確率、学習の修正だけに絞って追う。

AI LLM 機械学習数式入門

技術 2026年4月9日(木) 約16分

MegaTrainはシングルGPUで120BパラメータLLMをフル精度訓練する

CPUメモリを主記憶、GPUを一時的な計算装置として扱う逆転の発想で、100B超のLLMをシングルGPUでフル精度訓練するシステムMegaTrain。DeepSpeed ZeRO-3比で最大12.2倍のスループットを達成した。

LLM 機械学習 GPU DeepSpeed メモリ最適化

技術 2026年4月1日(水) 約10分

TRL v1.0がメジャーリリース、LLMポストトレーニングの安定基盤へ

HuggingFaceのLLMポストトレーニングライブラリTRLがv1.0に到達。Stable/Experimental二層モデルの導入、GRPO・DPO・SFTなど主要手法の安定化、非同期GRPOのロードマップが示された。

AI 機械学習強化学習 LLM HuggingFace

技術 2026年3月31日(火) 約7分

CloudflareがClient-Side SecurityのGNN+LLM検出を全ユーザーに開放、誤検知を200分の1に削減

Cloudflareがクライアントサイドの悪意あるスクリプト検出にGNNとLLMの2段カスケードを導入し、ユニークスクリプトあたりの誤検知率を1.39%から0.007%に削減。有料アドオンだったAdvanced機能をセルフサーブ顧客にも開放した。

Cloudflare セキュリティ GNN LLM XSS サプライチェーン機械学習

技術 2026年3月23日(月) 約14分

BERT+Qwen OCR校正パイプラインをPythonツールにした

BERT perplexityスキャン→LLM判定→エスカレーションの3段パイプラインを、Win/Mac/Linux対応のPythonツールにパッケージング。インストーラーがllama-serverとGGUFモデルまで自動で落としてくる。

自然言語処理 OCR 機械学習 Python BERT LLM llama.cpp Qwen NDLOCR-Lite Gradio Ollama 実験

技術 2026年3月11日(水) 約6分

16のオープンソースRLライブラリで見えたLLM非同期訓練の設計パターン

HuggingFaceが16のオープンソースRL訓練ライブラリを7つの設計軸で比較分析。同期型では生成ボトルネックでGPU利用率が60%程度に留まるが、非同期分離設計で95%以上に改善できる。

AI 機械学習強化学習 LLM