#AIエージェント

84 件の記事

技術2026年5月5日(火)約13分

LLM向けTool-use APIは終了条件と再試行不可を返す設計にする

Claude Codeの1.67Bトークン事故を起点に、ツール結果にis_complete・retryable・予算上限を返すとなぜ無限ループが止まるかを掘り下げた。MCPサーバー設計にも直結する。

AI LLM AIエージェント API Claude Code MCP

技術2026年5月4日(月)約5分

CursorのCVE-2026-26268はGit hooksでAIエージェントのサンドボックスを抜ける

Cursor 2.5未満で修正されたCVE-2026-26268は、AIエージェントが保護不足の.git設定やGit hooksを書き換え、次のGit操作でサンドボックス外RCEにつながる脆弱性だった。

セキュリティ Cursor AI Coding AIエージェント CVE 脆弱性

技術2026年5月3日(日)約13分

CTXでClaude Codeに動くメモリを足す

Claude CodeのUserPromptSubmitフックで文脈を自動注入するCTXを読んだ。auto-memory、YourMemory、WUPHF、Cloudflare Agent Memoryとの差をセッション跨ぎと保存先の軸で並べた。1Mコンテキストに揃っても足りない理由と、同じ1Mでもエージェントごとにウィンドウの使い方が違う点を確認した。

Claude Code AIエージェントトークン管理 RAG OSS

技術2026年5月2日(土)約10分

かなチャット v3とブログ特化に寄せた話

正規CLIラッパー型AIエージェント「かなチャット」のv2からv3への変化。OpenClaw自前路線から後退して、AIニュース・論文の濁流を素早くドラフト化するブログパイプラインに寄せた経緯と現状。

AIエージェント Claude Code Codex OpenClaw Gemini tmux FastAPI Tailscale 自作ツール実験

技術2026年5月2日(土)約13分

OCR-Memoryはエージェントの履歴を画像として思い出す

arXiv:2604.26622のOCR-Memoryを読んだ。エージェントの長い実行履歴を画像化し、Set-of-Markで該当箇所だけ選ばせ、元ログから逐語テキストを戻すメモリ方式だ。

AI AIエージェント OCR VLM RAG トークン管理論文

技術2026年4月30日(木)約7分

OpenAI Codexのサンドボックス迂回をZDIがゼロデイとして公開

ZDI-26-305として公開されたOpenAI Codexのサンドボックス迂回脆弱性。悪意あるJavaScriptを含むリポジトリをCodexで処理した場合に、サンドボックス外でユーザー権限のコード実行へつながるとされる。

OpenAI Codex セキュリティ脆弱性 AIエージェント Sandbox

技術2026年4月30日(木)約10分

信頼度スコアで文書抽出の人手確認を絞る

フィールド単位の信頼度スコアで人手確認を絞る設計と、freee MCPで仕訳自動化を試して踏んだOCR・閾値の壁。

AI OCR VLM MCP AIエージェント API

技術2026年4月29日(水)約8分

Playwright MCPにbrowser_dropが入ってドラッグ操作が普通のツールになった

Playwright MCP v0.0.71でbrowser_dropが追加された。MCPクライアントからLocator.dropを呼べるようになり、ドラッグ&ドロップ系UIをevaluateやmouse.move連鎖でごまかす場面が減る。ドラッグ中の中間イベント発火やCSS動的変化のスクリーンショット検証についても整理した。

Playwright MCP CLI AIエージェントテスト

技術2026年4月28日(火)約14分

AIエージェント間通信の署名検証にERC-8128を使う理由と仕組み

AIエージェントが暗号資産を扱う前提で通信の出所を証明する標準としてERC-8128が出てきた。ERC・メッセージ署名の基礎から、APIキーやOAuthとの違い、実装の流れまで整理する。

Security AIエージェント Ethereum Web3

技術2026年4月27日(月)約7分

YourMemoryは生物学的減衰でAIメモリの古い文脈を捨てる

sachitrafa/YourMemoryを調べた。Ebbinghaus忘却曲線、BM25、ベクトル検索、グラフ展開を組み合わせたローカルMCPメモリで、LoCoMo-10のRecall@5は現在59%とされている。

AI AIエージェント MCP RAG Claude Code トークン管理

技術2026年4月27日(月)約9分

安全モニタの評価器を狙うsecond-order injection

LLM安全モニタの評価器が、監視対象のセッション本文に埋め込まれた命令で判定を上書きされる問題。second-order injectionの実験結果、防御の限界、実装上の分離ポイントを整理する。

セキュリティ LLM Prompt Injection LLM安全性 AIエージェント

技術2026年4月27日(月)約9分

CLIからAIへ、人間がソフトウェアと話す入口が変わる

CLI、GUI、チャットUI、AIエージェントの変遷を開発現場のインターフェース設計として読み直す。CUIではなくCLIが選ばれる経緯、MCPとCLIのコンテキスト消費の差も含めた。

AI CLI UI UX AIエージェント