技術 2026年6月9日(火) 約11分 Apple Foundation Models第3世代は20Bオンデバイス疎モデルとGoogle Cloud上のPCCに分かれた Appleが2026年6月8日に公開したAFM 3は、3B dense、20B sparse on-device、Private Cloud Compute上のCloud、Cloud Pro、Imageで構成される。Google協業、NVIDIA GPU、Foundation Models frameworkの開放まで含めて、開発者が確認する差分を見る。 AI LLM Apple Silicon Google エッジAI
技術 2026年6月8日(月) 約17分 LFM2.5 1.2B JP 202606をM1 Max 64GBで動かしたらデコード208tok/sでJSON守るがモデル名をハルシネーションした Liquid AIのLFM2.5-1.2B-JP-202606をM1 Max 64GBで実測。llama.cpp/Ollama/MLXの3系統でデコード速度・JSON構造化・ツール呼び出し・会話のナチュラルさ・長文入力を検証した。Q4_K_Mで208tok/s、Q8_0で157tok/sだがモデル名ハルシネーションが消える差も出た。 AI LLM ローカルLLM MLX Ollama Apple Silicon エッジAI 実験 日本語LLM
技術 2026年2月8日(日) 更新 約6分 LFM2.5 — Transformerでもない、Mambaでもないハイブリッドアーキテクチャ Liquid AIのLFM2.5は、短距離畳み込みとAttentionのハイブリッドで、SSMを使わずにエッジ最適化を実現した。アーキテクチャの仕組み、ベンチマーク、コミュニティ活用例をまとめた。 AI LLM エッジAI アーキテクチャ