メリアム・ウェブスターとブリタニカがOpenAIを著作権侵害で提訴
2026年3月16日、Encyclopedia BritannicaとMerriam-Websterが、OpenAIを著作権侵害で提訴した。両社は、OpenAIがLLM(大規模言語モデル)の学習に約10万件の自社記事を無断で使用したと主張している。
訴訟の概要
訴状によれば、OpenAIはBritannicaとMerriam-Websterが長年にわたって構築してきた百科事典・辞書コンテンツを、許可も補償もなくAIモデルの学習データとして取り込んだ。両社は著作権侵害の差し止めと損害賠償を求めている。
Merriam-Websterは1828年創業、Britannicaは1768年創業という、英語圏で最も権威ある参照情報源だ。この2社が同時にOpenAIを訴えたのは初めてのことになる。
なぜ辞書・百科事典か
一般的な書籍や記事と異なり、辞書・百科事典は定義・事実・解説を正確に記述することを主目的とした参照データだ。LLMが「知識」を習得する際、こうした構造化された説明文は特に価値が高い。
Merriam-Websterは英語の標準的な語義・語源・用例を提供し、Britannicaは数万トピックにわたる百科的知識を網羅している。原告側は、OpenAIがこれらのコンテンツの価値を認識しながら対価を支払わずに利用したと主張する。
AI著作権訴訟の流れの中での位置づけ
AIを巡る著作権訴訟はここ数年で急増している。主要な事例を並べると以下になる。
| 原告 | 提訴時期 | 主な主張 |
|---|---|---|
| Getty Images | 2023年 | 画像の無断学習(Stability AI) |
| The New York Times | 2023年 | 記事の無断学習(OpenAI・Microsoft) |
| 作家グループ(John Grisham他) | 2023年 | 小説の無断学習(OpenAI) |
| Merriam-Webster・Britannica | 2026年 | 辞書・百科事典記事の無断学習(OpenAI) |
NYT訴訟が「報道記事の再現」を問題にしたのに対し、今回の訴訟は「定義情報の構造的抽出」という側面が強い。辞書や百科事典の記事は、曖昧な感情や文脈に依存する通常の文章とは異なり、意味の確定的な記述を含む。LLMがこうしたコンテンツをどう内部化しているかは、フェアユース(著作権の制限的利用)の判断にも影響しうる。
フェアユース論争の核心
OpenAI側が持ち出すのは「変形的利用(transformative use)」の理論だ。学習データとして使うことは著作物を「変形」しており、著作権侵害にはあたらないという主張だ。
一方、原告側はこの解釈に異議を唱える。モデルが記事の要約や類似した説明を生成できるなら、それは元の著作物の「市場代替」に当たると主張する。特にBritannica・Merriam-Websterのようなサービスは、ユーザーが正確な定義・解説を求めてアクセスするものであり、LLMがその機能を代替すれば直接的な収益損失につながる。
米国著作権法のフェアユース判断は4要素からなる。
| 要素 | 内容 |
|---|---|
| 利用の目的・性質 | 変形的か、商業的か |
| 著作物の性質 | 事実的・創作的のどちらか |
| 利用量・実質性 | 全体のどの程度が利用されたか |
| 市場への影響 | 原著作物の市場を害するか |
辞書・百科事典は「事実的著作物」であり、一般に創作的著作物より保護が弱いとされる。ただし約10万件という規模での系統的利用や、サービスの市場代替性が認定されれば、フェアユースの主張は難しくなる。
OpenAIへの影響
OpenAIはこれまでのAI著作権訴訟に対し、フェアユースを主張し法廷で争う姿勢を取り続けている。NYT訴訟は現在も係争中で、業界全体の学習データ取得方針に影響しうる判決はまだ出ていない。
今回の訴訟が加わることで、OpenAIが抱える訴訟はさらに増えた。仮に原告側が勝訴すれば、過去の学習データに関する遡及的な補償義務が生じうるし、フェアユース解釈の先例として他の訴訟にも波及する。