技術 2026年3月12日(木) 約14分 GitHubのエージェント実行基盤とOpenAI IH-Challengeによるプロンプトインジェクション対策 GitHubがエージェント実行基盤の多層防御設計を公開し、OpenAIはinstruction hierarchy訓練データIH-Challengeとモデルを発表。インフラ設計と訓練の両軸からプロンプトインジェクションへの応答が出揃った。 AI セキュリティ GitHub OpenAI AIエージェント LLM安全性
技術 2026年3月10日(火) 約6分 OpenAIのPromptfoo買収とMicrosoftのマルチモデル転換 OpenAIがAIセキュリティ評価プラットフォームPromptfooを買収、同日MicrosoftはAnthropicのClaude CoworkをM365 Copilotに採用。エンタープライズAI市場の構造が変わり始めた。 OpenAI Microsoft Anthropic Claude セキュリティ Red Teaming Copilot Enterprise AI
技術 2026年3月10日(火) 約8分 AIエージェントのローカル隔離実行、macOS sandbox-execとWindowsサンドボックスで何が違うか AIコーディングエージェントのローカル隔離実行を実現する2つのアプローチ。macOSはAgent SafehouseがOSネイティブのsandbox-execでカーネルレベル制限、WindowsはCodexがVMベースのWindowsサンドボックスを活用する。 AIエージェント セキュリティ macOS Windows Claude Code OpenAI
技術 2026年3月6日(金) 約10分 OpenAI GPT-5.3/5.4の連続リリースとSaguaroによる推論高速化 GPT-5.3 Instantのハルシネーション削減と安全性退行、GPT-5.4のcomputer use・Tool Search・1Mトークンコンテキスト、そしてSaguaroが実現した推論5倍高速化をまとめた。 LLM OpenAI GPT 推論最適化 Speculative Decoding AI安全性 Computer Use
技術 2026年3月4日(水) 約7分 Amazon Bedrock MantleエンジンのOpenAI API互換が一般提供開始、DeepSeekやMistralで既存SDKが使える AWSのBedrock分散推論エンジンMantleがOpenAI API互換を提供開始。Chat Completions APIとResponses APIに対応し、OpenAI SDKのコードをそのままGoogle/DeepSeek/Mistral等のオープンウェイトモデルに使い回せる。 AWS Amazon Bedrock OpenAI API LLM
技術 2026年2月28日(土) 約8分 GitHub Copilot coding agentの大幅更新とFigma-Codex MCP統合 モデル選択・セルフレビュー・セキュリティスキャン・カスタムエージェント・CLI連携の5機能追加と、FigmaのMCPサーバーを介したCodex双方向連携。Copilot CLIのGA、Claude Code Figma統合との比較も含めて整理した。 GitHub Copilot Figma OpenAI Codex MCP AI Coding
技術 2026年2月24日(火) 約8分 Claudeの大規模不正蒸留とSWE-benchの崩壊が同時に来た Anthropicが中国AI3社によるClaude蒸留を告発し、同日OpenAIがSWE-bench Verifiedを廃止。訓練の不正と評価の欠陥が同時に露呈した2026年2月23日の出来事を整理する。 AI Security Anthropic DeepSeek Benchmark LLM OpenAI SWE-bench
技術 2026年2月24日(火) 更新 約8分 AIエージェントメモリへの注入攻撃とEVMbenchによるスマートコントラクト自動悪用 AIエージェントのメモリファイルを汚染するMINJA・InjecMEM・ToxicSkillsキャンペーンの手法と防御策、そしてOpenAIとParadigmが公開したEVMbenchでGPT-5.3-Codexが72%のexploit成功率を記録した事実。AIが「攻撃の標的」にも「攻撃の武器」にもなる構造を整理する。 セキュリティ AIエージェント Prompt Injection MCP Ethereum スマートコントラクト OpenAI サプライチェーン
技術 2026年1月19日(月) 約3分 Claude Code + Codex 自動開発フレームワークを汎用化して公開した 実践編・改善編で作ったスクリプトを汎用フレームワーク化してGitHubで公開。使い方と設計思想の解説。 Claude Code OpenAI Codex tmux AI 自動化 実験
技術 2026年1月17日(土) 約5分 tmuxでClaude CodeとCodexを連携させて一晩放置でゲームを作らせる(改善編) AI自動開発ループのコンテキスト使用量とAPI呼び出しを削減する設計パターン。ブロッキング待機、読み禁止ファイル、セッション分離の3つの改善策。 Claude Code OpenAI Codex tmux AI 自動化 実験
技術 2026年1月15日(木) 更新 約9分 tmuxでClaude CodeとCodexを連携させて一晩放置でゲームを作らせる(実践編) Claude Code + Codex自動ループを実際に動かしてみた。1134行のゲームコードが生成された。 Claude Code OpenAI Codex tmux AI 自動化 実験
技術 2026年1月14日(水) 約5分 tmuxでClaude CodeとCodexを連携させて一晩放置でゲームを作らせる(準備編) Claude CodeとOpenAI Codexをtmuxで連携させ、実装→レビュー→修正のループを自動化する方法。一晩放置で何か作れるか試す前の技術的準備。 Claude Code OpenAI Codex tmux AI 自動化 実験