#エッジAI

3 件の記事

技術 2026年6月9日(火) 約11分

Apple Foundation Models第3世代は20Bオンデバイス疎モデルとGoogle Cloud上のPCCに分かれた

Appleが2026年6月8日に公開したAFM 3は、3B dense、20B sparse on-device、Private Cloud Compute上のCloud、Cloud Pro、Imageで構成される。Google協業、NVIDIA GPU、Foundation Models frameworkの開放まで含めて、開発者が確認する差分を見る。

AI LLM Apple Silicon Google エッジAI

技術 2026年6月8日(月) 約17分

LFM2.5 1.2B JP 202606をM1 Max 64GBで動かしたらデコード208tok/sでJSON守るがモデル名をハルシネーションした

Liquid AIのLFM2.5-1.2B-JP-202606をM1 Max 64GBで実測。llama.cpp/Ollama/MLXの3系統でデコード速度・JSON構造化・ツール呼び出し・会話のナチュラルさ・長文入力を検証した。Q4_K_Mで208tok/s、Q8_0で157tok/sだがモデル名ハルシネーションが消える差も出た。

AI LLM ローカルLLM MLX Ollama Apple Silicon エッジAI 実験日本語LLM

技術 2026年2月8日(日) 更新約6分

LFM2.5 — Transformerでもない、Mambaでもないハイブリッドアーキテクチャ

Liquid AIのLFM2.5は、短距離畳み込みとAttentionのハイブリッドで、SSMを使わずにエッジ最適化を実現した。アーキテクチャの仕組み、ベンチマーク、コミュニティ活用例をまとめた。

AI LLM エッジAI アーキテクチャ