技術 2026年6月25日(木) 約11分 Krea 2をM1 MaxのComfyUIで試す Turboは3分強で回り、Rawは47分かけて黒画像 2026年6月公開のKrea 2 Raw/TurboをM1 Max 64GBのComfyUIで実機検証。12B DiTはbf16なら載りTurboは約3分半/枚で回るが、fp8拡散はMPSで弾かれ、Raw(52step+CFG3.5)は47分かけてNaNで黒画像になった。速度・メモリ・写実/アニメ/文字の品質、NSFWの通り具合とアンフィルターノードの実際、ライセンスまで。 AI 画像生成 ComfyUI Apple Silicon MPS 実験
技術 2026年6月18日(木) 約8分 Boogu-Image-0.1をM1 MaxのComfyUIで試す fp8はMPSで弾かれ、bf16なら回る 2026年6月16日公開のBoogu-Image-0.1をM1 Max 64GBのComfyUIで実機検証。公式はCUDA/fp8前提でMacの記載がゼロ。fp8はMPS非対応で弾かれbf16必須、Turboは1枚約70秒で回った。人物・アニメ・文字描画・NSFWの通り具合と、MacでComfyUIを上げるときの速度の注意まで。 AI 画像生成 ComfyUI Apple Silicon MPS 実験
技術 2026年5月2日(土) 約19分 Qwen-ScopeのSAEをM1 Max 64GBで動かして日本語特徴を取り出す Qwen-ScopeのSparse AutoencoderをローカルのM1 Max 64GBで動かし、Qwen3-8B-Baseの中間層から日本語・英語・コード・中国語を弁別する特徴IDを取り出した記録。 AI LLM Qwen 解釈可能性 実験 Apple Silicon MPS
技術 2026年4月21日(火) 約18分 TRELLIS.2をM1 Max 64GBで動かしてみた検証ログ CUDAフリー移植のTRELLIS.2(trellis-mac)をM1 Max 64GB環境で実際に動かし、セットアップ・生成時間・出力品質・ボトルネックを記録する検証記事。 AppleSilicon MPS PyTorch 3D ML 実験
技術 2026年4月20日(月) 更新 約9分 TRELLIS.2をApple SiliconのMPSで動かすCUDAフリー移植 CUDA専用ライブラリに依存するMicrosoftのTRELLIS.2(4Bパラメータ image-to-3D)をpure-PyTorchで代替実装し、M4 ProでNVIDIA GPUなしの動作を実現した移植の技術詳細。 AppleSilicon MPS PyTorch 3D ローカルLLM ML
技術 2026年3月26日(木) 約10分 ComfyUIアプデ後にQwen Image Editが10分かかるようになった原因を特定した MPSのBF16演算がFP16の2倍遅い問題と、FP16 Attentionバグが重なって発生した速度劣化の原因と対策 ComfyUI Qwen Apple Silicon MPS PyTorch 実験
技術 2026年3月23日(月) 約7分 397Bパラメータモデルを48GB MacBookで動かすFlash-MoE Flash-MoEはQwen3.5-397B-A17BをMacBook Pro M3 Maxで4.36トークン/秒で実行するC/Metal推論エンジン。SSDからのエキスパートストリーミングと手書きMetalシェーダーで209GBのモデルを48GBのメモリ環境に収めた。 Inference MPS LLM Qwen MoE ローカルLLM
技術 2026年2月13日(金) 更新 約5分 ComfyUIのUpscaleがMac MPSで壊れる問題をcontiguousで直した Load Image経由のUpscaleで画像が崩壊する問題を、テンソルのnon-contiguous対策で修正した記録。2026-04-29にComfyUI更新で上書きされて再発したのでPyTorch側の上流issueと再発の経緯も追記。 ComfyUI Apple Silicon PyTorch MPS 実験