#RAG

19 件の記事

技術2026年5月11日(月)更新約9分

Gemini API File Searchのマルチモーダル化はゲームNPCの記憶にも使えそう

Gemini API File Searchがマルチモーダル対応し、画像とテキストを同じstoreで検索できるようになった。metadata filterでNPC記憶を章やキャラで絞り込める点と、1キャラ月$1未満の料金試算からゲーム用途の実用性を見る。

AI Gemini RAG API ゲーム

技術2026年5月8日(金)約7分

IFしか知らない人が3か月でCivicSurvivalを作れた理由

DEVのCivicSurvival開発記録を読んだ。158K行のCities: Skylines II modを支えたのはAIへの丸投げではなく、CivicRAG、300超のRoslyn analyzer、ビルド失敗、目視確認でAIを縛る運用だった。

AI AIエージェント Claude Code MCP RAG ゲーム

技術2026年5月8日(金)約11分

AIが同じ好みを聞き返すならVektor Memoryのsupersession chainsを見る

Vektor Memory v1.5.4のsupersession chainsを読む。意味的近傍で古い好みを退役させる仕組みを、YourMemoryの時間減衰、Cloudflareのキー上書き、CTXの取り出し分けと並べて整理し、自前エージェント（かなチャットのHeartbeatメモリ）への最小実装まで落とす。

AI AIエージェント RAG MCP トークン管理 Node.js

技術2026年5月7日(木)約10分

エージェントメモリは記憶ではなくメモという論文を読んだ

arXiv:2604.27707の主張を、CTXやOCR-Memoryのような検索系メモリと並べて読む。RAG、vector store、scratchpadは便利な検索棚だが、経験からルールを重みに畳み込む学習とは別物だ。

AI AIエージェント RAG トークン管理 AIセーフティ論文

技術2026年5月3日(日)約13分

CTXでClaude Codeに動くメモリを足す

Claude CodeのUserPromptSubmitフックで文脈を自動注入するCTXを読んだ。auto-memory、YourMemory、WUPHF、Cloudflare Agent Memoryとの差をセッション跨ぎと保存先の軸で並べた。1Mコンテキストに揃っても足りない理由と、同じ1Mでもエージェントごとにウィンドウの使い方が違う点を確認した。

Claude Code AIエージェントトークン管理 RAG OSS

技術2026年5月2日(土)約22分

FastAPI・Chroma・Open WebUI・Ollamaでマルチモーダル日本語RAGをM1 Maxで組んだ

DEV記事のPDF RAGをM1 Max 64GBで実装し、CLIPで画像、bge-m3 + Qwen3.6 35Bで日本語まで通した実験ログ。モダリティギャップ、推論サーバー並走クラッシュ、LLM-jp 4-8Bの指示追従失敗まで実機の挙動を記録。

AI LLM RAG ローカルLLM FastAPI llama.cpp Chroma Python Apple Silicon Ollama 日本語LLM 実験

技術2026年5月2日(土)更新約11分

FastAPI・llama.cpp・Chroma・Open WebUIでPDF用ローカルRAGを組む記事を読んだ

DEV Communityの記事をもとに、FastAPIでOpenAI互換RAG APIを作り、llama.cpp、Chroma、Open WebUIをつなぐ構成の位置づけと実装上の落とし穴を整理する。

AI LLM RAG ローカルLLM FastAPI llama.cpp Chroma Python Docker

技術2026年5月2日(土)約13分

OCR-Memoryはエージェントの履歴を画像として思い出す

arXiv:2604.26622のOCR-Memoryを読んだ。エージェントの長い実行履歴を画像化し、Set-of-Markで該当箇所だけ選ばせ、元ログから逐語テキストを戻すメモリ方式だ。

AI AIエージェント OCR VLM RAG トークン管理論文

技術2026年4月30日(木)約7分

Rust/WASM製VecLiteでブラウザ内RAGの検索部分が現実味を帯びた

VecLiteはRust/WASM+SIMDでブラウザ内ベクトル検索を高速化するライブラリ。Transformers.jsで埋め込みを作り、IndexedDBに保存し、サーバーなしでRAGを組むときにどこが詰まるかを整理する。

Rust WebAssembly RAG Embedding AI Coding

技術2026年4月27日(月)約7分

YourMemoryは生物学的減衰でAIメモリの古い文脈を捨てる

sachitrafa/YourMemoryを調べた。Ebbinghaus忘却曲線、BM25、ベクトル検索、グラフ展開を組み合わせたローカルMCPメモリで、LoCoMo-10のRecall@5は現在59%とされている。

AI AIエージェント MCP RAG Claude Code トークン管理

技術2026年4月24日(金)約9分

デジタル庁がガバメントAI「源内」をオープンソース化、RAG・LLMセルフデプロイ・法制度AIのテンプレートを商用利用可で公開

デジタル庁が中央省庁で展開中の生成AI利用環境「源内」を、MIT / CC BY 4.0でGitHubに公開した。Webアプリ本体と、AWS・Azure・Google Cloudそれぞれのクラウド向けAI開発テンプレートがセットで公開されており、地方自治体や民間でも再利用できる。

AI LLM RAG オープンソース国策 AWS Azure Google Cloud

技術2026年4月23日(木)約18分

open-notebookをDockerもクラウドAPIも使わずM1 Maxで動かしてqwen3.6:35bに自分の記事を読ませた

NotebookLMクローンのopen-notebookはデフォルトがDocker前提＋クラウドAPI前提。SurrealDBをネイティブで入れて4プロセスをtmuxで立ち上げ、Ollamaのqwen3.6:35bとbge-m3だけでRAGを回した。自分が今朝書いたQwen3.6比較記事を食わせたら、正しい数値で答えた。

AI LLM ローカルLLM Ollama Qwen Apple Silicon RAG OSS 実験