技術2026年5月5日(火)約13分LLM向けTool-use APIは終了条件と再試行不可を返す設計にするClaude Codeの1.67Bトークン事故を起点に、ツール結果にis_complete・retryable・予算上限を返すとなぜ無限ループが止まるかを掘り下げた。MCPサーバー設計にも直結する。AILLMAIエージェントAPIClaude CodeMCP
技術2026年5月4日(月)約5分CursorのCVE-2026-26268はGit hooksでAIエージェントのサンドボックスを抜けるCursor 2.5未満で修正されたCVE-2026-26268は、AIエージェントが保護不足の.git設定やGit hooksを書き換え、次のGit操作でサンドボックス外RCEにつながる脆弱性だった。セキュリティCursorAI CodingAIエージェントCVE脆弱性
技術2026年5月3日(日)約13分CTXでClaude Codeに動くメモリを足すClaude CodeのUserPromptSubmitフックで文脈を自動注入するCTXを読んだ。auto-memory、YourMemory、WUPHF、Cloudflare Agent Memoryとの差をセッション跨ぎと保存先の軸で並べた。1Mコンテキストに揃っても足りない理由と、同じ1Mでもエージェントごとにウィンドウの使い方が違う点を確認した。Claude CodeAIエージェントトークン管理RAGOSS
技術2026年5月2日(土)約10分かなチャット v3とブログ特化に寄せた話正規CLIラッパー型AIエージェント「かなチャット」のv2からv3への変化。OpenClaw自前路線から後退して、AIニュース・論文の濁流を素早くドラフト化するブログパイプラインに寄せた経緯と現状。AIエージェントClaude CodeCodexOpenClawGeminitmuxFastAPITailscale自作ツール実験
技術2026年5月2日(土)約13分OCR-Memoryはエージェントの履歴を画像として思い出すarXiv:2604.26622のOCR-Memoryを読んだ。エージェントの長い実行履歴を画像化し、Set-of-Markで該当箇所だけ選ばせ、元ログから逐語テキストを戻すメモリ方式だ。AIAIエージェントOCRVLMRAGトークン管理論文
技術2026年4月30日(木)約7分OpenAI Codexのサンドボックス迂回をZDIがゼロデイとして公開ZDI-26-305として公開されたOpenAI Codexのサンドボックス迂回脆弱性。悪意あるJavaScriptを含むリポジトリをCodexで処理した場合に、サンドボックス外でユーザー権限のコード実行へつながるとされる。OpenAICodexセキュリティ脆弱性AIエージェントSandbox
技術2026年4月30日(木)約10分信頼度スコアで文書抽出の人手確認を絞るフィールド単位の信頼度スコアで人手確認を絞る設計と、freee MCPで仕訳自動化を試して踏んだOCR・閾値の壁。AIOCRVLMMCPAIエージェントAPI
技術2026年4月29日(水)約8分Playwright MCPにbrowser_dropが入ってドラッグ操作が普通のツールになったPlaywright MCP v0.0.71でbrowser_dropが追加された。MCPクライアントからLocator.dropを呼べるようになり、ドラッグ&ドロップ系UIをevaluateやmouse.move連鎖でごまかす場面が減る。ドラッグ中の中間イベント発火やCSS動的変化のスクリーンショット検証についても整理した。PlaywrightMCPCLIAIエージェントテスト
技術2026年4月28日(火)約14分AIエージェント間通信の署名検証にERC-8128を使う理由と仕組みAIエージェントが暗号資産を扱う前提で通信の出所を証明する標準としてERC-8128が出てきた。ERC・メッセージ署名の基礎から、APIキーやOAuthとの違い、実装の流れまで整理する。SecurityAIエージェントEthereumWeb3
技術2026年4月27日(月)約7分YourMemoryは生物学的減衰でAIメモリの古い文脈を捨てるsachitrafa/YourMemoryを調べた。Ebbinghaus忘却曲線、BM25、ベクトル検索、グラフ展開を組み合わせたローカルMCPメモリで、LoCoMo-10のRecall@5は現在59%とされている。AIAIエージェントMCPRAGClaude Codeトークン管理
技術2026年4月27日(月)約9分安全モニタの評価器を狙うsecond-order injectionLLM安全モニタの評価器が、監視対象のセッション本文に埋め込まれた命令で判定を上書きされる問題。second-order injectionの実験結果、防御の限界、実装上の分離ポイントを整理する。セキュリティLLMPrompt InjectionLLM安全性AIエージェント
技術2026年4月27日(月)約9分CLIからAIへ、人間がソフトウェアと話す入口が変わるCLI、GUI、チャットUI、AIエージェントの変遷を開発現場のインターフェース設計として読み直す。CUIではなくCLIが選ばれる経緯、MCPとCLIのコンテキスト消費の差も含めた。AICLIUIUXAIエージェント