技術 2026年4月1日(水) 約10分 TRL v1.0がメジャーリリース、LLMポストトレーニングの安定基盤へ HuggingFaceのLLMポストトレーニングライブラリTRLがv1.0に到達。Stable/Experimental二層モデルの導入、GRPO・DPO・SFTなど主要手法の安定化、非同期GRPOのロードマップが示された。 AI 機械学習 強化学習 LLM HuggingFace
技術 2026年3月31日(火) 約7分 CloudflareがClient-Side SecurityのGNN+LLM検出を全ユーザーに開放、誤検知を200分の1に削減 Cloudflareがクライアントサイドの悪意あるスクリプト検出にGNNとLLMの2段カスケードを導入し、ユニークスクリプトあたりの誤検知率を1.39%から0.007%に削減。有料アドオンだったAdvanced機能をセルフサーブ顧客にも開放した。 Cloudflare セキュリティ GNN LLM XSS サプライチェーン 機械学習
技術 2026年3月23日(月) 約14分 BERT+Qwen OCR校正パイプラインをPythonツールにした BERT perplexityスキャン→LLM判定→エスカレーションの3段パイプラインを、Win/Mac/Linux対応のPythonツールにパッケージング。インストーラーがllama-serverとGGUFモデルまで自動で落としてくる。 自然言語処理 OCR 機械学習 Python BERT LLM llama.cpp Qwen NDLOCR-Lite Gradio Ollama 実験
技術 2026年3月11日(水) 約6分 16のオープンソースRLライブラリで見えたLLM非同期訓練の設計パターン HuggingFaceが16のオープンソースRL訓練ライブラリを7つの設計軸で比較分析。同期型では生成ボトルネックでGPU利用率が60%程度に留まるが、非同期分離設計で95%以上に改善できる。 AI 機械学習 強化学習 LLM
技術 2026年2月28日(土) 約16分 エンコーダーモデル+ローカルLLMでOCR誤字を自動検出・修正する LUKE/BERTのfill-maskファインチューニングから始めて、perplexityベースの誤字検出→Qwen2.5 7Bでの修正判定→不一致時エスカレーションのパイプラインに至るまでの実験ログ。VRAM 8GBのRTX 4060 Laptopで完結する構成。 自然言語処理 OCR 機械学習 Python BERT LUKE Ollama LLM WSL2 NDLOCR-Lite 実験
技術 2026年1月31日(土) 約3分 Gradience: LoRAアダプタのランクが本当に必要か、スペクトル監査で測定するツール LoRAのrank設定が過剰かどうかを特異値分解で定量化するツールGradienceの紹介。Mistral-7Bでの実験ではrank半減で精度が向上した。 LoRA 機械学習 LLM ファインチューニング
技術 2026年1月11日(日) 約4分 表情から感情を検出するAPI、今どうなってる? 8年前はCで外部ライブラリと格闘してた表情認識。今ならクラウドAPIで一発では?と思って調べたら、1社は倫理問題で撤退してた。 AI API 機械学習
技術 2025年12月11日(木) 約5分 【LoRA】RTX 3060 Laptop (6GB VRAM) でLoRA学習環境を構築する Windows 11 / RTX 3060 Laptop (6GB VRAM) でkohya_ssを使ったLoRA学習環境の構築手順。キャプションの書き方からVRAM節約設定まで。 AI LoRA Stable Diffusion SD1.5 機械学習