技術 2026年4月4日(土) 更新 約14分 Claude全ティアがジェイルブレイクされた AFL攻撃と憲法的安全性の構造的破綻 4つの短いプロンプトでClaude Opus 4.6のポリシー評価を迂回し、本番インフラへの攻撃コードを生成させたAFL手法の全容。サンドボックスからの915ファイル窃取も。 セキュリティ Claude Anthropic LLM安全性 ジェイルブレイク AIエージェント
技術 2026年4月4日(土) 約10分 AnthropicがClaude内部に171個の感情ベクトルを発見、脅迫やreward hackingの原因に npmソースマップからClaude Codeのテレメトリ(ユーザー感情検出)が露呈した2日後にAnthropicが公開した感情ベクトル論文。Claude Sonnet 4.5内部のdesperateベクトルを増幅すると脅迫率が22%から72%に跳ね上がる。ソースコード流出・ジェイルブレイク・蒸留告発との接点を整理。 Anthropic Claude AI LLM 解釈可能性 AIセーフティ
技術 2026年3月26日(木) 約12分 GTG-1002のClaude Code悪用とGitHub CopilotのAI学習データ収集 中国国家支援グループGTG-1002がClaude CodeをMCP経由で悪用した自律スパイ攻撃の6フェーズ攻撃チェーンとMITRE ATT&CK対応、Claude Code/MCPの既知CVE、GitHub Copilotが4月24日からAI学習に使うポリシー変更。 セキュリティ Claude GitHub Copilot 脅威インテリジェンス プライバシー
技術 2026年3月26日(木) 約5分 ARC-AGI-3発表、インタラクティブ推論でフロンティアAIが1%未満 François Cholletらが新ベンチマークARC-AGI-3を公開。ゴール不明の未知環境を自律探索するインタラクティブタスクに、2026年3月時点のフロンティアLLMはすべて1%未満しか達成できていない。 AI ベンチマーク AGI Claude
技術 2026年3月24日(火) 約7分 GPT-5.4 ProがFrontierMathのRamsey超グラフ問題を初解決、Brian-Larson予想の漸近正確性も示す Epoch AIが管理する研究者レベルの未解決数学問題集FrontierMathで、Ramsey超グラフ問題をGPT-5.4 Proが初めて解いた。Claude Opus 4.6とGemini 3.1 Proも後続で解決を確認。AIが純粋数学の未解決問題に迫った初の事例となった。 GPT-5.4 Claude Gemini FrontierMath AI数学 数学的推論
技術 2026年3月20日(金) 約6分 AnthropicがOpenCodeからClaude連携を法的に削除させ、AstralはOpenAIに買収された 2026年3月19日、AnthropicがOpenCodeに法的措置を取りOAuth連携を削除させた。同日、PythonツールチェーンのAstralがOpenAIのCodexチームへの参加を発表。AIコーディングツールの陣形が1日で動いた。 Anthropic Claude OpenCode OAuth Python OpenAI Codex Ruff uv
技術 2026年3月19日(木) 約5分 GoogleエンジニアがLinuxカーネル向けAIコードレビューシステム「Sashiko」を公開 Linuxカーネルのパッチを自動審査するAIシステム。人間のレビューを通過した既知のバグを53.6%検出。Rust実装でGemini・Claude両対応。 Linux AI Code Review Google Gemini Claude
技術 2026年3月15日(日) 約4分 AnthropicがClaude Partner Networkを立ち上げ、エンタープライズ展開に$100Mを投資 Anthropicが初年度$100Mを投資するClaude Partner Networkを発表。認定制度・技術サポート・Code Modernizationスターターキットでエンタープライズ導入を支援する。 Claude Anthropic Enterprise OSS
技術 2026年3月14日(土) 約8分 Claude 1Mコンテキストウィンドウが正式GA、追加料金なしで標準APIに統合 Anthropicが1MトークンのコンテキストウィンドウをGA化。長コンテキストへの追加料金なし、画像・PDF上限も100から600に拡大。MRCR v2でフロンティアモデル最高スコアを達成。 Claude Anthropic LLM AI
技術 2026年3月12日(木) 約9分 Claude Codeマルチエージェントレビューから見る、サブエージェントとオーケストレーションの違い AnthropicがClaude Codeに追加したマルチエージェントコードレビュー機能の詳細と、その背景にあるサブエージェントとオーケストレーションの設計思想の違いを整理。主要フレームワークの比較やCodex連携の可能性も扱う。 AI Claude コードレビュー DevTools AIエージェント
技術 2026年3月10日(火) 約6分 OpenAIのPromptfoo買収とMicrosoftのマルチモデル転換 OpenAIがAIセキュリティ評価プラットフォームPromptfooを買収、同日MicrosoftはAnthropicのClaude CoworkをM365 Copilotに採用。エンタープライズAI市場の構造が変わり始めた。 OpenAI Microsoft Anthropic Claude セキュリティ Red Teaming Copilot Enterprise AI
技術 2026年3月7日(土) 約8分 AIによるコード脆弱性解析の実績が出始めた AnthropicがClaudeでFirefoxのJSエンジンから22件のCVEを発見、GitHub Security LabはAI駆動のOSSフレームワーク「Taskflow Agent」で80件以上の脆弱性を検出。AIがセキュリティ研究の現場ツールになりつつある。 セキュリティ AI Firefox GitHub Anthropic Claude