技術 2026年4月9日(木) 約16分 MegaTrainはシングルGPUで120BパラメータLLMをフル精度訓練する CPUメモリを主記憶、GPUを一時的な計算装置として扱う逆転の発想で、100B超のLLMをシングルGPUでフル精度訓練するシステムMegaTrain。DeepSpeed ZeRO-3比で最大12.2倍のスループットを達成した。 LLM 機械学習 GPU DeepSpeed メモリ最適化
技術 2026年4月9日(木) 約11分 MetaがLlamaを捨てて作ったMuse Sparkと新組織Meta Superintelligence Labs Metaが新AI組織MSLのもとで初モデルMuse Sparkを発表。Scale AI買収の狙い、オープンウェイトからプロプライエタリへの転換、Contemplatingモードのマルチエージェント推論、ベンチマーク結果と評価認識問題を掘り下げる。 Meta Muse Spark AI LLM Alexandr Wang
技術 2026年4月8日(水) 約10分 HP Sprocket 200のBLEプロトコルを解析してPCから印刷した スマホ専用モバイルフォトプリンターHP Sprocket 200のBLE通信プロトコル(HPLPP)を解析し、Pythonスクリプトで直接印刷に成功した。 Bluetooth BLE ハードウェア Python 実験
技術 2026年4月6日(月) 約12分 LLM-jp-4-32B-A3BをROCm + Strix HaloでベンチマークしたらQwen3.5より41%速かった NIIが公開したLLM-jp-4-32B-A3B-thinkingをEVO-X2(Ryzen AI Max+ 395)のROCmで動かした。62.9 t/sでQwen3.5-35B-A3Bの44.7 t/sを大きく上回るが、thinking制御やKVキャッシュ消費、知識カットオフに課題あり。日本語比較テストとコード生成テストの結果も。 AI LLM ローカルLLM llama.cpp AMD ROCm MoE Qwen 実験
技術 2026年4月3日(金) 約8分 LemonadeをStrix Halo (EVO-X2) で動かしたらVulkanの共有メモリ漏れとROCmの安定性が見えた AMD Lemonade v10.0.1をRyzen AI Max+ 395環境で検証。LLM・画像生成・音声認識・音声合成の4モデル同時起動、NPU Hybrid実行、Vulkan vs ROCmの実測比較と共有メモリ漏れの発見まで。 AMD ローカルLLM Vulkan ROCm NPU llama.cpp GPU 推論最適化 ベンチマーク 実験