技術 2026年2月24日(火) 約8分 Claudeの大規模不正蒸留とSWE-benchの崩壊が同時に来た Anthropicが中国AI3社によるClaude蒸留を告発し、同日OpenAIがSWE-bench Verifiedを廃止。訓練の不正と評価の欠陥が同時に露呈した2026年2月23日の出来事を整理する。 AI Security Anthropic DeepSeek Benchmark LLM OpenAI SWE-bench
技術 2026年2月24日(火) 更新 約6分 Claude Code SecurityのAI推論ベース脆弱性検出 Anthropicが発表したClaude Code Securityの技術的アプローチ、偽陽性対策、GitHub Action、競合ツールとの比較、そしてサイバーセキュリティ株$15B吹き飛びの背景を整理する。 Anthropic Claude Security SAST AI GitHub Actions 脆弱性検出
技術 2026年2月24日(火) 更新 約7分 npmサプライチェーンワーム「SANDWORM_MODE」がAI開発環境を標的にクリプトキーとCI secretsを窃取 Socketが19個の悪意あるnpmパッケージを使ったアクティブな攻撃キャンペーンを報告。Claude・Cursor・VS CodeなどのAI開発環境を特に標的とし、SSH鍵・npmトークン・APIキーを窃取したうえでワーム伝播する。 npm Security Supply Chain Malware AI Development
技術 2026年2月24日(火) 更新 約8分 AIエージェントメモリへの注入攻撃とEVMbenchによるスマートコントラクト自動悪用 AIエージェントのメモリファイルを汚染するMINJA・InjecMEM・ToxicSkillsキャンペーンの手法と防御策、そしてOpenAIとParadigmが公開したEVMbenchでGPT-5.3-Codexが72%のexploit成功率を記録した事実。AIが「攻撃の標的」にも「攻撃の武器」にもなる構造を整理する。 AIセキュリティ AI Agent Prompt Injection MCP Ethereum スマートコントラクト OpenAI Supply Chain Attack
技術 2026年2月23日(月) 更新 約14分 Webコンポーネント vs ReactとDependabot vs govulncheckで開発スタックを問い直す 「本当にReactが要るのか」というWebコンポーネント再評価論と、「DependabotをオフにしてGo脆弱性チェックに切り替える」という主張。どちらも長年の標準とされてきたツール選択を、技術的根拠をもとに問い直している。 Web Components フロントエンド JavaScript Go DevOps セキュリティ OSS
技術 2026年2月23日(月) 更新 約12分 AIで侵害し、AIで守り、人間が穴を開ける(2026年2月セキュリティまとめ) DeepSeekとClaudeを駆使して106カ国のFortiGateを自動スキャンしたキャンペーン、MFAを無効化するリバースプロキシ型PhaaS Starkiller、AnthropicのClaude Code Securityが本番OSSで500件超の脆弱性を発見、そしてPayPalがコードミスで6ヶ月間SSNを露出していた事実。 セキュリティ FortiGate フィッシング MFA AI Claude Anthropic PayPal データ漏洩 脆弱性検出 PhaaS 脅威インテリジェンス
技術 2026年2月23日(月) 更新 約10分 AIコーディングエージェントを本番に載せるための設計原則 Stripe Minions、Amazon Kiro、Claude Code compaction、Replit DB削除。複数の事例を横断し、AIコーディングエージェントの本番運用に必要な設計原則を抽出する。CodeRabbitの470リポジトリ統計やGoogle・GitHubの取り組みも交えて整理した。 AIエージェント Stripe MCP コーディングエージェント AWS Amazon Claude Code インシデント 設計 Replit
技術 2026年2月22日(日) 更新 約6分 CISA KEV追加の重大脆弱性4件(ChromiumゼロデイからデフォルトRCEまで) 同じ週にCISA KEVカタログへ追加されたChromium CSSエンジンUAF、Roundcubeの10年潜伏RCE、BeyondTrustのランサムウェア悪用RCE、Daguのデフォルト認証なしRCE。4件すべてで即時パッチ適用が必要。 セキュリティ 脆弱性 CISA KEV RCE ゼロデイ Chromium Roundcube BeyondTrust
技術 2026年2月22日(日) 更新 約7分 AIエージェントオーケストレーションClawsとCord Andrej KarpathyがAIエージェントの上位レイヤーとして「Claws」を命名し、June KimはMCPとSQLiteで実装したCordフレームワークで同じ問いに別の角度から答えた。単発実行エージェントから自律的な調整システムへの移行を概念と実装の両面から整理する。 AI AIエージェント Agent MCP LLM Architecture Karpathy
技術 2026年2月21日(土) 更新 約8分 AIコーディングツールの壊れ方3種(本番環境削除・コンテキスト喪失・使用量枯渇) Kiroが本番環境を自律削除してAWSが13時間停止、Claude Codeのauto-compactionがコンテキストを非可逆に消去、サブエージェントが使用量を見えないまま食い潰す。同じ週に出た3つの障害記録。 AI AIエージェント Claude Code AWS Amazon コーディングエージェント インシデント 設計
技術 2026年2月21日(土) 約8分 StripeのAIコーディングエージェント「Minions」の内部アーキテクチャ詳解 週1300件以上のPRをゼロ人力で生成するStripeのMinionsエージェント。Devbox、Blueprints、Toolshed、gooseフォークの4コンポーネントの実装詳細。 AIエージェント Stripe MCP コーディングエージェント アーキテクチャ
技術 2026年2月20日(金) 更新 約5分 Googleエンジニア起訴とMuMuプレイヤーの偵察コマンド問題 元Googleエンジニア3名がイランへの機密転送で起訴された事件と、NetEase製MuMu PlayerがmacOSで30分ごとに17種のシステム偵察コマンドを実行していた問題。ソフトウェアと人への信頼が揺らいだ週の記録。 セキュリティ プライバシー インサイダー脅威 macOS Google