OpenAIのPromptfoo買収とMicrosoftのマルチモデル転換

2026年3月10日、エンタープライズAI市場で2つの動きが重なった。OpenAIがAIセキュリティ評価プラットフォーム「Promptfoo」の買収を発表し、MicrosoftはAnthropicの「Claude Cowork」をMicrosoft 365 Copilotに統合すると発表した。

それぞれ別の文脈で発表されたが、組み合わせると見えてくるものがある。AIをエンタープライズに本格的に持ち込む段階で何が問題になっているかが、この2つのニュースに集約されている。

OpenAIがPromptfooを買収した背景

Promptfooは、AIアプリケーションのセキュリティテスト・評価プラットフォームだ。プロンプトインジェクション、ジェイルブレイク、データ漏洩、ビジネスルール違反など50種類以上の脆弱性を自動でシミュレートする。Fortune 500企業127社を含む30万人以上の開発者が利用しており、OpenAI・Anthropic・Google・Microsoftからもコントリビューターが参加してきた。

Promptfooが提供する機能は4つに整理できる。

機能	概要
レッドチーミング	50種類以上の脆弱性パターンで攻撃的テストを自動実行
コードスキャニング	IDEとCI/CDに統合してLLM固有の脆弱性を静的解析
ガードレール	本番環境でジェイルブレイクや敵対的攻撃をリアルタイム検知・ブロック
評価	プロンプト改善・モデル差し替え・RAGチューニング時に品質を定量測定

OpenAIにとってこの買収の意味は単純で、エンタープライズ向けにモデルを提供するだけでなく「そのモデルを安全に使う検証基盤」をセットで提供できる体制を作ることにある。ChatGPT EnterpriseやAPIの企業利用が拡大するなか、OpenAIはプラットフォーム事業者として「自社AIが安全に使われているかを検証する手段の提供」を課題として認識してきた。

AIエージェント化が進む文脈でこの買収を見ると意図がより明確になる。エージェントが自律的にツールを呼び出し、データを操作し、外部サービスと連携するようになると、静的なプロンプトインジェクション対策だけでは不十分になる。Promptfooのレッドチーミング能力はエージェント実行時の動的なリスク評価にも応用できる。

OSSコミュニティへの影響

Promptfooはオープンソース（MIT/Apache 2.0）として公開されていた。買収後のOSS継続方針は今後の発表待ちだが、Anthropic・Google・MicrosoftからのコントリビューターがいるプロジェクトをOpenAIが完全統合した後、中立性がどう保たれるかは注目点になる。買収金額は公開されていない。

MicrosoftがOpenAI一強を手放した理由

同日、MicrosoftはMicrosoft 365 Copilotの新バージョン「Wave 3」を発表し、AnthropicのClaude CoworkをCopilot Coworkとして統合することを明らかにした。リサーチプレビューとして限定公開が始まっている。

これまでMicrosoft 365 CopilotはOpenAIのモデルだけを使ってきた。MicrosoftはOpenAIに多額の投資を行い、Azure OpenAI Serviceとの深い連携を基盤としてCopilotを構築してきた。その体制が変わった。Wave 3の発表では「マルチモデルインテリジェンス」がキーワードとして登場しており、特定モデルへの依存から脱却してタスクに応じた最適なモデルを選択する方向性が示された。

OpenAI以外のAIベンダーがMicrosoft 365 Copilotに採用されるのは今回が初めてだ。

Copilot Coworkの機能

Copilot CoworkはいわゆるコンピューターユースAAIエージェント機能だ。IT部門向けのコーディング支援ではなく、一般のビジネスパーソンがPCで日常的にこなす作業を自律的に処理することを目指している。

対応する業務は次のような内容になる。

Webブラウザを操作して情報を収集・集計する
複数のファイルやアプリケーションをまたいでデータを処理する
メール・チャットの送受信を含む一連のコミュニケーション処理
会議の議事録作成と関連タスクへの展開

単一ターンや単一アプリケーション内の処理に限らず、複数ステップに分解した作業を数分から数時間にわたって継続実行できる点が特徴だ。Microsoftの公式ブログでは「複雑なリクエストを複数のステップに分解し、ツールやファイルを横断的に推論し、作業の進捗と方向性を可視化しながら進める」と説明されている。

ベースになるClaude Coworkとは

Copilot CoworkのベースになるClaude Coworkは、AnthropicのClaude Codeのエージェント機能を汎用業務自動化向けに拡張したものだ。Claude Codeがソフトウェア開発タスクに特化していたのに対し、Claude CoworkはWebブラウザ操作やオフィス業務まで対象範囲を広げている。

AnthropicはClaude 3.5 Sonnetで実験的なコンピューターユース機能を公開してきた経緯があり、Claude Coworkはその延長線上のエンタープライズ向け製品と位置付けられる。

マルチエージェント構成との関係

Wave 3ではCopilot Cowork以外にも、Copilot Agentsと呼ばれる専門エージェントを複数組み合わせるアーキテクチャが導入されている。Excel向けのデータ分析エージェントなど特定タスクに特化したエージェントが、Copilot Coworkと並列・連携して動作する構成が想定されている。Copilot Coworkが汎用的な業務フロー全体を担い、専門エージェントが個別ツール内の深い処理を担う役割分担だ。

現時点ではリサーチプレビュー段階で、正式リリースのスケジュールは未発表。Microsoft 365のユーザー数は全世界で3億人超とされており、本格展開されればClaude Coworkはこれまでにないスケールでビジネス現場に接触することになる。

同日に起きたことの意味

OpenAIがPromptfooを買収し、MicrosoftがAnthropicを採用した。この2つの出来事を並べると、エンタープライズAI市場の現在地が浮かび上がる。

AIプラットフォームが多様化している。 MicrosoftがOpenAI一強から脱却した事実は、「タスクに応じて最適なモデルを使う」という判断が大企業でも現実的な選択肢になったことを示している。モデルの多様化は顧客にとっては選択肢が増えることを意味する一方、AIベンダーにとっては機能・性能・信頼性での差別化競争が続くことを意味する。

セキュリティ検証がプラットフォーム機能になっている。 OpenAIがPromptfooを取り込んだのは、AIを使ったアプリケーションのセキュリティ検証をエコシステムの標準機能として提供するためだ。かつてはDevSecOpsやPenetrationテストが後付けで導入されてきたように、AIセキュリティテストもプラットフォームへの組み込みが進む段階に入った。

AIがエンタープライズに展開されるほど、これら2つの課題—どのモデルをどの用途に使うかという選択と、そのモデルが安全に動いているかの検証—は避けられなくなる。3月10日の2つのニュースはその現実を異なる角度から照らしていた。

なお、AIエージェント実行基盤のセキュリティ設計については、GitHubが同時期に詳細なアーキテクチャを公開している。ゼロシークレット設計やセーフアウトプット検証の具体的な実装については GitHub Agentic Workflowsのセキュリティ設計を参照。