技術 2026年5月11日(月) 更新 約9分 Gemini API File Searchのマルチモーダル化はゲームNPCの記憶にも使えそう Gemini API File Searchがマルチモーダル対応し、画像とテキストを同じstoreで検索できるようになった。metadata filterでNPC記憶を章やキャラで絞り込める点と、1キャラ月$1未満の料金試算からゲーム用途の実用性を見る。 AI Gemini RAG API ゲーム
技術 2026年5月8日(金) 約7分 IFしか知らない人が3か月でCivicSurvivalを作れた理由 DEVのCivicSurvival開発記録を読んだ。158K行のCities: Skylines II modを支えたのはAIへの丸投げではなく、CivicRAG、300超のRoslyn analyzer、ビルド失敗、目視確認でAIを縛る運用だった。 AI AIエージェント Claude Code MCP RAG ゲーム
技術 2026年5月8日(金) 約11分 AIが同じ好みを聞き返すならVektor Memoryのsupersession chainsを見る Vektor Memory v1.5.4のsupersession chainsを読む。意味的近傍で古い好みを退役させる仕組みを、YourMemoryの時間減衰、Cloudflareのキー上書き、CTXの取り出し分けと並べて整理し、自前エージェント(かなチャットのHeartbeatメモリ)への最小実装まで落とす。 AI AIエージェント RAG MCP トークン管理 Node.js
技術 2026年5月7日(木) 約10分 エージェントメモリは記憶ではなくメモという論文を読んだ arXiv:2604.27707の主張を、CTXやOCR-Memoryのような検索系メモリと並べて読む。RAG、vector store、scratchpadは便利な検索棚だが、経験からルールを重みに畳み込む学習とは別物だ。 AI AIエージェント RAG トークン管理 AIセーフティ 論文
技術 2026年5月3日(日) 約13分 CTXでClaude Codeに動くメモリを足す Claude CodeのUserPromptSubmitフックで文脈を自動注入するCTXを読んだ。auto-memory、YourMemory、WUPHF、Cloudflare Agent Memoryとの差をセッション跨ぎと保存先の軸で並べた。1Mコンテキストに揃っても足りない理由と、同じ1Mでもエージェントごとにウィンドウの使い方が違う点を確認した。 Claude Code AIエージェント トークン管理 RAG OSS
技術 2026年5月2日(土) 約22分 FastAPI・Chroma・Open WebUI・Ollamaでマルチモーダル日本語RAGをM1 Maxで組んだ DEV記事のPDF RAGをM1 Max 64GBで実装し、CLIPで画像、bge-m3 + Qwen3.6 35Bで日本語まで通した実験ログ。モダリティギャップ、推論サーバー並走クラッシュ、LLM-jp 4-8Bの指示追従失敗まで実機の挙動を記録。 AI LLM RAG ローカルLLM FastAPI llama.cpp Chroma Python Apple Silicon Ollama 日本語LLM 実験
技術 2026年5月2日(土) 更新 約11分 FastAPI・llama.cpp・Chroma・Open WebUIでPDF用ローカルRAGを組む記事を読んだ DEV Communityの記事をもとに、FastAPIでOpenAI互換RAG APIを作り、llama.cpp、Chroma、Open WebUIをつなぐ構成の位置づけと実装上の落とし穴を整理する。 AI LLM RAG ローカルLLM FastAPI llama.cpp Chroma Python Docker
技術 2026年5月2日(土) 約13分 OCR-Memoryはエージェントの履歴を画像として思い出す arXiv:2604.26622のOCR-Memoryを読んだ。エージェントの長い実行履歴を画像化し、Set-of-Markで該当箇所だけ選ばせ、元ログから逐語テキストを戻すメモリ方式だ。 AI AIエージェント OCR VLM RAG トークン管理 論文
技術 2026年4月30日(木) 約7分 Rust/WASM製VecLiteでブラウザ内RAGの検索部分が現実味を帯びた VecLiteはRust/WASM+SIMDでブラウザ内ベクトル検索を高速化するライブラリ。Transformers.jsで埋め込みを作り、IndexedDBに保存し、サーバーなしでRAGを組むときにどこが詰まるかを整理する。 Rust WebAssembly RAG Embedding AI Coding
技術 2026年4月27日(月) 約7分 YourMemoryは生物学的減衰でAIメモリの古い文脈を捨てる sachitrafa/YourMemoryを調べた。Ebbinghaus忘却曲線、BM25、ベクトル検索、グラフ展開を組み合わせたローカルMCPメモリで、LoCoMo-10のRecall@5は現在59%とされている。 AI AIエージェント MCP RAG Claude Code トークン管理
技術 2026年4月24日(金) 約9分 デジタル庁がガバメントAI「源内」をオープンソース化、RAG・LLMセルフデプロイ・法制度AIのテンプレートを商用利用可で公開 デジタル庁が中央省庁で展開中の生成AI利用環境「源内」を、MIT / CC BY 4.0でGitHubに公開した。Webアプリ本体と、AWS・Azure・Google Cloudそれぞれのクラウド向けAI開発テンプレートがセットで公開されており、地方自治体や民間でも再利用できる。 AI LLM RAG オープンソース 国策 AWS Azure Google Cloud
技術 2026年4月23日(木) 約18分 open-notebookをDockerもクラウドAPIも使わずM1 Maxで動かしてqwen3.6:35bに自分の記事を読ませた NotebookLMクローンのopen-notebookはデフォルトがDocker前提+クラウドAPI前提。SurrealDBをネイティブで入れて4プロセスをtmuxで立ち上げ、Ollamaのqwen3.6:35bとbge-m3だけでRAGを回した。自分が今朝書いたQwen3.6比較記事を食わせたら、正しい数値で答えた。 AI LLM ローカルLLM Ollama Qwen Apple Silicon RAG OSS 実験