技術 2026年4月13日(月) 約11分 AnthropicのキャッシュTTL無告知変更とClaude Codeクォータ枯渇の構造 Claude Code Max 5xは「Proの5倍」だが基準値は非公開。使用量確認手段はターミナル起動時のグラフや/usageなど相対表示のみで、クォータの分母が不明。TTL無告知変更と1.5時間でのクォータ枯渇を通じて浮き彫りになった、Anthropicのクォータ不透明性。 Claude Code Anthropic Prompt Caching APIプライシング AIエージェント
技術 2026年4月13日(月) 約10分 MicrosoftのFoundry Local正式リリース、アプリにバンドルして配布できるローカルAIランタイム アプリのビルドに約20MBのネイティブライブラリとして組み込めるローカルAIランタイム。ONNX RuntimeベースでGPU/NPU自動選択、OpenAI互換APIでPhi・Qwen・Mistral等をオフラインで動かせる。 Microsoft ローカルLLM Azure AI Foundry ONNX Runtime Windows ML
技術 2026年4月13日(月) 約9分 「同僚をAIに蒸留する」OSSを見て、自分の蒸留方法を調べた colleague.skill、yourself-skill、nuwa-skillなど「人間蒸留」OSSが中国を中心に爆発的に広がっている。同僚を蒸留するツールを見て「逆に自分を蒸留したら?」と思い、実際のやり方を調べた。 AI OSS GitHub Claude Code AIエージェント
技術 2026年4月8日(水) 約10分 HP Sprocket 200のBLEプロトコルを解析してPCから印刷した スマホ専用モバイルフォトプリンターHP Sprocket 200のBLE通信プロトコル(HPLPP)を解析し、Pythonスクリプトで直接印刷に成功した。 Bluetooth BLE ハードウェア Python 実験
技術 2026年4月6日(月) 約12分 LLM-jp-4-32B-A3BをROCm + Strix HaloでベンチマークしたらQwen3.5より41%速かった NIIが公開したLLM-jp-4-32B-A3B-thinkingをEVO-X2(Ryzen AI Max+ 395)のROCmで動かした。62.9 t/sでQwen3.5-35B-A3Bの44.7 t/sを大きく上回るが、thinking制御やKVキャッシュ消費、知識カットオフに課題あり。日本語比較テストとコード生成テストの結果も。 AI LLM ローカルLLM llama.cpp AMD ROCm MoE Qwen 実験
技術 2026年4月3日(金) 約8分 LemonadeをStrix Halo (EVO-X2) で動かしたらVulkanの共有メモリ漏れとROCmの安定性が見えた AMD Lemonade v10.0.1をRyzen AI Max+ 395環境で検証。LLM・画像生成・音声認識・音声合成の4モデル同時起動、NPU Hybrid実行、Vulkan vs ROCmの実測比較と共有メモリ漏れの発見まで。 AMD ローカルLLM Vulkan ROCm NPU llama.cpp GPU 推論最適化 ベンチマーク 実験