技術 2026年4月21日(火) 約18分 TRELLIS.2をM1 Max 64GBで動かしてみた検証ログ CUDAフリー移植のTRELLIS.2(trellis-mac)をM1 Max 64GB環境で実際に動かし、セットアップ・生成時間・出力品質・ボトルネックを記録する検証記事。 AppleSilicon MPS PyTorch 3D ML 実験
技術 2026年4月20日(月) 更新 約9分 TRELLIS.2をApple SiliconのMPSで動かすCUDAフリー移植 CUDA専用ライブラリに依存するMicrosoftのTRELLIS.2(4Bパラメータ image-to-3D)をpure-PyTorchで代替実装し、M4 ProでNVIDIA GPUなしの動作を実現した移植の技術詳細。 AppleSilicon MPS PyTorch 3D ローカルLLM ML
技術 2026年4月19日(日) 約12分 WebAssemblyとMetalでゼロコピーGPU推論をApple Siliconに実装する mmap→MTLBuffer(bytesNoCopy)→Wasmtime MemoryCreatorの3段チェーンで、WasmリニアメモリとGPUバッファの物理アドレスを一致させる実装。M1上でLlama 3.2 1Bを9ms/tokenで動かした。 WebAssembly Metal AppleSilicon MLX Wasmtime LLM