技術 2026年2月19日(木) 更新 約7分 IT-BenchとMASTが示すAIエージェントのエンタープライズ業務における失敗構造 IBMとUC Berkeleyが公開したIT-BenchベンチマークとMAST障害分類法から、エンタープライズAIエージェントがなぜ失敗するかを掘り下げる。SRE成功率11%、FinOps 0%という現実と、Replit本番DB削除事件が示す実害。 AI AIエージェント IBM ベンチマーク