技術 2026年2月24日(火) 約8分 Claudeの大規模不正蒸留とSWE-benchの崩壊が同時に来た Anthropicが中国AI3社によるClaude蒸留を告発し、同日OpenAIがSWE-bench Verifiedを廃止。訓練の不正と評価の欠陥が同時に露呈した2026年2月23日の出来事を整理する。 AI Security Anthropic DeepSeek Benchmark LLM OpenAI SWE-bench
技術 2026年2月24日(火) 更新 約8分 AIエージェントメモリへの注入攻撃とEVMbenchによるスマートコントラクト自動悪用 AIエージェントのメモリファイルを汚染するMINJA・InjecMEM・ToxicSkillsキャンペーンの手法と防御策、そしてOpenAIとParadigmが公開したEVMbenchでGPT-5.3-Codexが72%のexploit成功率を記録した事実。AIが「攻撃の標的」にも「攻撃の武器」にもなる構造を整理する。 セキュリティ AIエージェント Prompt Injection MCP Ethereum スマートコントラクト OpenAI サプライチェーン
技術 2026年1月19日(月) 約3分 Claude Code + Codex 自動開発フレームワークを汎用化して公開した 実践編・改善編で作ったスクリプトを汎用フレームワーク化してGitHubで公開。使い方と設計思想の解説。 Claude Code OpenAI Codex tmux AI 自動化 実験
技術 2026年1月17日(土) 約5分 tmuxでClaude CodeとCodexを連携させて一晩放置でゲームを作らせる(改善編) AI自動開発ループのコンテキスト使用量とAPI呼び出しを削減する設計パターン。ブロッキング待機、読み禁止ファイル、セッション分離の3つの改善策。 Claude Code OpenAI Codex tmux AI 自動化 実験
技術 2026年1月15日(木) 更新 約9分 tmuxでClaude CodeとCodexを連携させて一晩放置でゲームを作らせる(実践編) Claude Code + Codex自動ループを実際に動かしてみた。1134行のゲームコードが生成された。 Claude Code OpenAI Codex tmux AI 自動化 実験
技術 2026年1月14日(水) 約5分 tmuxでClaude CodeとCodexを連携させて一晩放置でゲームを作らせる(準備編) Claude CodeとOpenAI Codexをtmuxで連携させ、実装→レビュー→修正のループを自動化する方法。一晩放置で何か作れるか試す前の技術的準備。 Claude Code OpenAI Codex tmux AI 自動化 実験
技術 2026年1月13日(火) 約5分 AIと喋れる環境を作る(3)キャラクター設定編 Gemini、Claude、OpenAIの各APIでキャラクター設定を行い、ロールプレイ的な会話を実現する方法を比較。System Prompt、Prefill、構造化出力などの実装例を紹介。 AI LLM API Gemini Claude OpenAI 実験
技術 2026年1月10日(土) 約5分 AIと喋れる環境を作る(1)音声API調査編 キャラ付けAI+アバター+音声会話を目指して、まずは音声APIを比較調査してみた AI 音声合成 音声認識 TTS STT Gemini OpenAI ChatGPT VOICEVOX Google Cloud