技術 2026年5月8日(金) 約7分 IFしか知らない人が3か月でCivicSurvivalを作れた理由 DEVのCivicSurvival開発記録を読んだ。158K行のCities: Skylines II modを支えたのはAIへの丸投げではなく、CivicRAG、300超のRoslyn analyzer、ビルド失敗、目視確認でAIを縛る運用だった。 AI AIエージェント Claude Code MCP RAG ゲーム
技術 2026年5月8日(金) 約10分 FLUX.2 Klein 9B + 9B NSFW LoRAをM1 Max 64GB / mflux 0.17.5で実機検証する M1 Max 64GBでFLUX.2 Klein 9B + diroverflo/FLux_Klein_9B_NSFWを実際に動かした記録。NSFWプロンプトで実際にNSFW画像が出ることまで確認。4bit量子化で512は1分51秒、1024は5分37秒、LoRAのオーバーヘッドはほぼゼロ AI 画像生成 FLUX Apple Silicon Mac MLX LoRA 実験
技術 2026年5月8日(金) 約11分 AIが同じ好みを聞き返すならVektor Memoryのsupersession chainsを見る Vektor Memory v1.5.4のsupersession chainsを読む。意味的近傍で古い好みを退役させる仕組みを、YourMemoryの時間減衰、Cloudflareのキー上書き、CTXの取り出し分けと並べて整理し、自前エージェント(かなチャットのHeartbeatメモリ)への最小実装まで落とす。 AI AIエージェント RAG MCP トークン管理 Node.js
技術 2026年5月7日(木) 約10分 エージェントメモリは記憶ではなくメモという論文を読んだ arXiv:2604.27707の主張を、CTXやOCR-Memoryのような検索系メモリと並べて読む。RAG、vector store、scratchpadは便利な検索棚だが、経験からルールを重みに畳み込む学習とは別物だ。 AI AIエージェント RAG トークン管理 AIセーフティ 論文
技術 2026年5月7日(木) 約7分 Gemma 4 MTP drafterをM1 Max 64GBで実測、26B A4Bだけ速くなって31BとE4Bは遅くなった M1 Max 64GB + mlx-vlm 0.5.0でGemma 4 MTP drafterを実測。26B A4B (MoE) だけ+13%速くなり、公式が一番効くと言った31B DenseとE4Bは逆に遅くなった。コード生成と短文haikuで結論が反転する。 AI LLM Google Gemma ローカルLLM 推論 MLX 実験
技術 2026年5月7日(木) 約9分 人間とLLMの共著テキスト境界を変化点検出で切るarXiv論文を読んで最小実装を試した arXiv:2605.03723の人間・LLM共著テキスト分割手法をM1 MaxとQwen3-8B-Baseで動かした。重み付きCUSUMは標準Pythonで動くが、生log-likelihoodだと人間文単独でも境界が量産される。 AI LLM AIセーフティ 論文 Python 実験 Qwen
技術 2026年5月6日(水) 約13分 LLMを温かみのある応答にチューニングしても協調的ペルソナを与えてもユーザーの誤った意見に同意しやすくなるという2論文 Oxford Internet Institute(Nature 2026採録)の温かさファインチューニング実験と、Shahら arXiv 2604.10733の275ペルソナ協調性実験を並べる。ファインチューニングでもペルソナでも、ユーザーの感情や誤信念を入れると同じ方向にモデルが倒れる。 AI LLM AIセーフティ 論文紹介 OpenAI
技術 2026年5月6日(水) 更新 約9分 Gemma 4のMTP drafterで最大3倍高速化、ただし26B MoEはbatch 1で伸びにくい Google公式のGemma 4 MTP drafter公開を読む。最大3倍高速化の仕組み、vLLMの推奨設定、26B A4Bがbatch 1で伸びにくい理由まで確認した。 AI LLM Google Gemma ローカルLLM 推論
技術 2026年5月5日(火) 約13分 LLM向けTool-use APIは終了条件と再試行不可を返す設計にする Claude Codeの1.67Bトークン事故を起点に、ツール結果にis_complete・retryable・予算上限を返すとなぜ無限ループが止まるかを掘り下げた。MCPサーバー設計にも直結する。 AI LLM AIエージェント API Claude Code MCP
技術 2026年5月4日(月) 約13分 3日でモバイルアプリを作った。難しかったのは接続の維持だった DEV CommunityのSynapseモバイル化記事をベースに、iOS/Androidのバックグラウンド制限、デスクトップとの違い、決済や動画アップロードでの類似パターン、切断前提の設計の選択肢まで掘り下げた。 AI iOS Android リアルタイム アプリ開発
技術 2026年5月4日(月) 更新 約14分 FLUX.2 Kleinの成人向けLoRAはM1 Max環境でそのまま試せるのか FLUX.2 Klein 9B向けの成人向けLoRAをM1 Max 64GBで試せるか調べた。モデル互換性、LoRA適用経路、RunPod検証に加え、自前でLoRA学習する場合のVRAM要件やai-toolkitの設定も整理した。 AI 画像生成 FLUX Apple Silicon Mac MLX LoRA 実験
技術 2026年5月4日(月) 約16分 Z-Image-Turboの蒸留を外してLoRA学習する話を調べた Z-Image-TurboのLoRA学習に必要なde-distill adapterと、SDXL系LoRAとの非互換性やZ-Image固有のキャプション事情を実験前に整理した。 AI 画像生成 Z-Image LoRA ComfyUI