#MPS

8 件の記事

技術 2026年6月25日(木) 約11分

Krea 2をM1 MaxのComfyUIで試す Turboは3分強で回り、Rawは47分かけて黒画像

2026年6月公開のKrea 2 Raw/TurboをM1 Max 64GBのComfyUIで実機検証。12B DiTはbf16なら載りTurboは約3分半/枚で回るが、fp8拡散はMPSで弾かれ、Raw（52step+CFG3.5）は47分かけてNaNで黒画像になった。速度・メモリ・写実/アニメ/文字の品質、NSFWの通り具合とアンフィルターノードの実際、ライセンスまで。

AI 画像生成 ComfyUI Apple Silicon MPS 実験

技術 2026年6月18日(木) 約8分

Boogu-Image-0.1をM1 MaxのComfyUIで試す fp8はMPSで弾かれ、bf16なら回る

2026年6月16日公開のBoogu-Image-0.1をM1 Max 64GBのComfyUIで実機検証。公式はCUDA/fp8前提でMacの記載がゼロ。fp8はMPS非対応で弾かれbf16必須、Turboは1枚約70秒で回った。人物・アニメ・文字描画・NSFWの通り具合と、MacでComfyUIを上げるときの速度の注意まで。

AI 画像生成 ComfyUI Apple Silicon MPS 実験

技術 2026年5月2日(土) 約19分

Qwen-ScopeのSAEをM1 Max 64GBで動かして日本語特徴を取り出す

Qwen-ScopeのSparse AutoencoderをローカルのM1 Max 64GBで動かし、Qwen3-8B-Baseの中間層から日本語・英語・コード・中国語を弁別する特徴IDを取り出した記録。

AI LLM Qwen 解釈可能性実験 Apple Silicon MPS

技術 2026年4月21日(火) 約18分

TRELLIS.2をM1 Max 64GBで動かしてみた検証ログ

CUDAフリー移植のTRELLIS.2（trellis-mac）をM1 Max 64GB環境で実際に動かし、セットアップ・生成時間・出力品質・ボトルネックを記録する検証記事。

AppleSilicon MPS PyTorch 3D ML 実験

技術 2026年4月20日(月) 更新約9分

TRELLIS.2をApple SiliconのMPSで動かすCUDAフリー移植

CUDA専用ライブラリに依存するMicrosoftのTRELLIS.2（4Bパラメータ image-to-3D）をpure-PyTorchで代替実装し、M4 ProでNVIDIA GPUなしの動作を実現した移植の技術詳細。

AppleSilicon MPS PyTorch 3D ローカルLLM ML

技術 2026年3月26日(木) 約10分

ComfyUIアプデ後にQwen Image Editが10分かかるようになった原因を特定した

MPSのBF16演算がFP16の2倍遅い問題と、FP16 Attentionバグが重なって発生した速度劣化の原因と対策

ComfyUI Qwen Apple Silicon MPS PyTorch 実験

技術 2026年3月23日(月) 約7分

397Bパラメータモデルを48GB MacBookで動かすFlash-MoE

Flash-MoEはQwen3.5-397B-A17BをMacBook Pro M3 Maxで4.36トークン/秒で実行するC/Metal推論エンジン。SSDからのエキスパートストリーミングと手書きMetalシェーダーで209GBのモデルを48GBのメモリ環境に収めた。

Inference MPS LLM Qwen MoE ローカルLLM

技術 2026年2月13日(金) 更新約5分

ComfyUIのUpscaleがMac MPSで壊れる問題をcontiguousで直した

Load Image経由のUpscaleで画像が崩壊する問題を、テンソルのnon-contiguous対策で修正した記録。2026-04-29にComfyUI更新で上書きされて再発したのでPyTorch側の上流issueと再発の経緯も追記。

ComfyUI Apple Silicon PyTorch MPS 実験