#ROCm

7 件の記事

技術2026年6月26日(金)約12分

Radeon 8060S（EVO-X2 / ROCm）でFastWanとWan 14Bを実走 ZLUDAは諦めてTheRockのgfx1151ホイールで動かした

AMD Radeon 8060S（EVO-X2 / Strix Halo / 48GB UMA）でローカルWan動画生成を実走。ZLUDAは公式PyTorchと非互換で全滅し、AMD TheRockのgfx1151ホイールでネイティブROCmが動いた。FastWan 1.3Bは4分、Wan 14B I2Vは13.6分、ボトルネックはVAEデコードと16GB RAMのSegfault。

AI 動画生成 Wan ROCm AMD PyTorch 実験

技術2026年4月30日(木)約8分

Xiaomi MiMo-V2.5はMacやROCmで動かせるのか

Xiaomi MiMo-V2.5のウェイト公開後、Mac/ROCmとクラウドGPU（RunPod/GCE）での実行可否を調べた。手元機ではまだ厳しいが、RunPodの4x H200で約14ドル/時間、GCE SpotのH100なら約1.6ドル/時間で動かせる。

AI LLM ローカルLLM Xiaomi MoE Apple Silicon ROCm llama.cpp

技術2026年4月16日(木)約13分

AMD ROCmのCUDA追い上げはどこまで来たか

EE TimesのAMD AI Software VP Anush Elangovan氏インタビューをベースに、ROCmとCUDAのエコシステム差を整理。Strix HaloでROCmを使い続けて4回壊れた実体験と、NVIDIA・AMD・Apple Siliconの実務での使い分けも。

AMD NVIDIA ROCm CUDA GPU AIインフラ PyTorch MLX Apple Silicon

技術2026年4月6日(月)約12分

LLM-jp-4-32B-A3BをROCm + Strix HaloでベンチマークしたらQwen3.5より41%速かった

NIIが公開したLLM-jp-4-32B-A3B-thinkingをEVO-X2（Ryzen AI Max+ 395）のROCmで動かした。62.9 t/sでQwen3.5-35B-A3Bの44.7 t/sを大きく上回るが、thinking制御やKVキャッシュ消費、知識カットオフに課題あり。日本語比較テストとコード生成テストの結果も。

AI LLM ローカルLLM llama.cpp AMD ROCm MoE Qwen 実験

技術2026年4月3日(金)約8分

LemonadeをStrix Halo (EVO-X2) で動かしたらVulkanの共有メモリ漏れとROCmの安定性が見えた

AMD Lemonade v10.0.1をRyzen AI Max+ 395環境で検証。LLM・画像生成・音声認識・音声合成の4モデル同時起動、NPU Hybrid実行、Vulkan vs ROCmの実測比較と共有メモリ漏れの発見まで。

AMD ローカルLLM Vulkan ROCm NPU llama.cpp GPU 推論最適化ベンチマーク実験

技術2026年4月3日(金)更新約9分

AMD公式のローカルAIサーバーLemonade、GPU+NPUを束ねてLLM・画像・音声を一元提供

AMDが開発するオープンソースのローカルAIサーバーLemonadeは、llama.cppやFastFlowLMなど複数バックエンドをGPU/NPU/CPU横断で管理し、OpenAI互換APIでテキスト・画像・音声を統合提供する。

AMD ローカルLLM NPU GPU llama.cpp 推論最適化 ROCm Vulkan

技術2026年2月28日(土)更新約11分

abliteratedモデルをOllamaで動かそうとして全滅した話と、結局公式版で済んだ話

huihui-aiのQwen 3.5 abliteratedは全バリアントでゴミトークンを吐いて全滅。GLM-4.7-Flash abliteratedもテンプレート崩壊で使い物にならず、最終的に公式版+thinking無効が正解だった。

AI LLM Ollama ローカルLLM AMD LM Studio Vulkan ROCm 実験