技術 2026年5月7日(木) 約10分 エージェントメモリは記憶ではなくメモという論文を読んだ arXiv:2604.27707の主張を、CTXやOCR-Memoryのような検索系メモリと並べて読む。RAG、vector store、scratchpadは便利な検索棚だが、経験からルールを重みに畳み込む学習とは別物だ。 AI AIエージェント RAG トークン管理 AIセーフティ 論文
技術 2026年5月7日(木) 約7分 Gemma 4 MTP drafterをM1 Max 64GBで実測、26B A4Bだけ速くなって31BとE4Bは遅くなった M1 Max 64GB + mlx-vlm 0.5.0でGemma 4 MTP drafterを実測。26B A4B (MoE) だけ+13%速くなり、公式が一番効くと言った31B DenseとE4Bは逆に遅くなった。コード生成と短文haikuで結論が反転する。 AI LLM Google Gemma ローカルLLM 推論 MLX 実験
技術 2026年5月7日(木) 更新 約6分 lilting.chの本文フォントをGeistからGen Interface JPに差し替えた lilting.chのサンスを Geist から Gen Interface JP v0.1.2 へ差し替えた記録。jsDelivr 直で必要ウェイトだけを読み込み、Geist Mono はそのまま、和欧混植の見え方と第一印象まで。 CSS UI デザイン Web
技術 2026年5月7日(木) 約9分 人間とLLMの共著テキスト境界を変化点検出で切るarXiv論文を読んで最小実装を試した arXiv:2605.03723の人間・LLM共著テキスト分割手法をM1 MaxとQwen3-8B-Baseで動かした。重み付きCUSUMは標準Pythonで動くが、生log-likelihoodだと人間文単独でも境界が量産される。 AI LLM AIセーフティ 論文 Python 実験 Qwen
技術 2026年5月7日(木) 約7分 Quandoomはなぜ量子ビットでDOOMを動かせるのか 72,376量子ビット、8,000万ゲート。DOOMの1面を量子回路で作り直したQuandoomの論文とQASMを読んだ。可逆性の制約がゲーム描画を変える仕組みと、干渉なしでノートPCシミュレーションが成立する理由。 ゲーム開発 OSS 入門
技術 2026年5月6日(水) 約9分 Claude Codeのコンテキスト劣化は45分後ではなく開始前から始まる Claude Codeの長時間セッションが途中で鈍る理由を、DEV記事、Anthropic公式の1M context運用、ChromaのContext Rot研究、既存のCTX/Compresr記事とつないで読む。見る場所はモデル名より、CLAUDE.md、ツール出力、compact前後の情報落ちだ。 Claude Code AIエージェント トークン管理 開発効率化
技術 2026年5月6日(水) 約13分 LLMを温かみのある応答にチューニングしても協調的ペルソナを与えてもユーザーの誤った意見に同意しやすくなるという2論文 Oxford Internet Institute(Nature 2026採録)の温かさファインチューニング実験と、Shahら arXiv 2604.10733の275ペルソナ協調性実験を並べる。ファインチューニングでもペルソナでも、ユーザーの感情や誤信念を入れると同じ方向にモデルが倒れる。 AI LLM AIセーフティ 論文紹介 OpenAI
技術 2026年5月6日(水) 更新 約9分 Gemma 4のMTP drafterで最大3倍高速化、ただし26B MoEはbatch 1で伸びにくい Google公式のGemma 4 MTP drafter公開を読む。最大3倍高速化の仕組み、vLLMの推奨設定、26B A4Bがbatch 1で伸びにくい理由まで確認した。 AI LLM Google Gemma ローカルLLM 推論
技術 2026年5月6日(水) 約8分 Tailscaleの代替を考えるとWireGuardだけでは足りない TailscaleのLinuxまわりの侵襲性を避けたい人向けに、Headscale、NetBird、Netmaker、Nebula、Cloudflare Tunnelを比べ、閉じたネットワークへの即時アクセスと外部公開を分ける設計を考える。 Tailscale VPN WireGuard ネットワーク Cloudflare
技術 2026年5月6日(水) 約5分 Node.js 26.0.0が出た、Temporal標準有効化と10月LTS待ちの現実 Node.js 26.0.0の公式リリース確認メモ。Temporal標準有効化、V8 14.6、Undici 8、削除API、10月LTS化まで本番移行を待つ理由を短く見る。 Node.js JavaScript
技術 2026年5月5日(火) 約8分 WebSocketで米国株ティックデータを受けるとRESTポーリングで消えていた約定が見える RESTで1秒ごとに取りに行くと約定の順序とサイズが消える。WebSocketでティック単位に受けて、受信→キュー→永続化を分離するパイプライン構成と、QUIC(HTTP/3)で接続安定性を上げる話。 WebSocket API リアルタイム JavaScript Web Architecture
技術 2026年5月5日(火) 約9分 OllamaとローカルLLMでMCPサーバーを使うならブリッジが要る M1 Max 64GBでOllama経由のローカルLLMにMCPサーバーをつなぐと、MCPHostの非メンテ化、tool calling精度、コンテキスト消費で詰まる。公式SDKでの自作サーバー最小構成も載せた。 Ollama MCP ローカルLLM LLM AIエージェント