技術 2026年5月2日(土) 約19分 Qwen-ScopeのSAEをM1 Max 64GBで動かして日本語特徴を取り出す Qwen-ScopeのSparse AutoencoderをローカルのM1 Max 64GBで動かし、Qwen3-8B-Baseの中間層から日本語・英語・コード・中国語を弁別する特徴IDを取り出した記録。 AI LLM Qwen 解釈可能性 実験 Apple Silicon MPS
技術 2026年4月21日(火) 約18分 TRELLIS.2をM1 Max 64GBで動かしてみた検証ログ CUDAフリー移植のTRELLIS.2(trellis-mac)をM1 Max 64GB環境で実際に動かし、セットアップ・生成時間・出力品質・ボトルネックを記録する検証記事。 AppleSilicon MPS PyTorch 3D ML 実験
技術 2026年4月20日(月) 更新 約9分 TRELLIS.2をApple SiliconのMPSで動かすCUDAフリー移植 CUDA専用ライブラリに依存するMicrosoftのTRELLIS.2(4Bパラメータ image-to-3D)をpure-PyTorchで代替実装し、M4 ProでNVIDIA GPUなしの動作を実現した移植の技術詳細。 AppleSilicon MPS PyTorch 3D ローカルLLM ML
技術 2026年3月26日(木) 約10分 ComfyUIアプデ後にQwen Image Editが10分かかるようになった原因を特定した MPSのBF16演算がFP16の2倍遅い問題と、FP16 Attentionバグが重なって発生した速度劣化の原因と対策 ComfyUI Qwen Apple Silicon MPS PyTorch 実験
技術 2026年3月23日(月) 約7分 397Bパラメータモデルを48GB MacBookで動かすFlash-MoE Flash-MoEはQwen3.5-397B-A17BをMacBook Pro M3 Maxで4.36トークン/秒で実行するC/Metal推論エンジン。SSDからのエキスパートストリーミングと手書きMetalシェーダーで209GBのモデルを48GBのメモリ環境に収めた。 Inference MPS LLM Qwen MoE ローカルLLM
技術 2026年2月13日(金) 更新 約5分 ComfyUIのUpscaleがMac MPSで壊れる問題をcontiguousで直した Load Image経由のUpscaleで画像が崩壊する問題を、テンソルのnon-contiguous対策で修正した記録。2026-04-29にComfyUI更新で上書きされて再発したのでPyTorch側の上流issueと再発の経緯も追記。 ComfyUI Apple Silicon PyTorch MPS 実験