大英百科全书起诉OpenAI：ChatGPT被控侵权复制内容

大英百科全书与OpenAI的版权之战

2026年3月16日，大英百科全书（Encyclopedia Britannica） 与词典出版商梅里亚姆-韦伯斯特（Merriam-Webster） 正式向OpenAI提起诉讼，指控其未经许可使用受版权保护的内容训练AI模型，并生成与原始内容“实质性相似”的回应。这起诉讼是近年来出版业与AI公司之间版权纠纷的最新案例，凸显了生成式AI发展中的法律与伦理挑战。

核心指控：未经授权的“记忆”与复制

根据诉讼文件，大英百科全书指出，GPT-4“记忆”了大量其受版权保护的内容，并在用户请求时输出近乎逐字复制的段落。诉讼中提供了OpenAI模型回应与大英百科全书原文的对比示例，显示整段文字几乎完全匹配。

大英百科全书声称，OpenAI反复复制其内容而未获许可，这些“记忆”的示例是用于训练GPT-4等模型的未经授权副本。这不仅涉及版权侵权，还影响了出版商的商业模式。

对传统出版业的冲击

诉讼进一步指控OpenAI通过生成与大英百科全书内容“替代或直接竞争”的回应，“蚕食”其网络流量。与传统搜索引擎不同，AI模型直接提供答案，而非引导用户访问原始网站，这可能减少出版商的广告收入和订阅转化。

行业背景：AI训练数据的版权争议

这起诉讼是出版业针对AI公司的一系列版权诉讼中的最新一起。例如：

《纽约时报》 在针对OpenAI的诉讼中提出了类似指控，指责其大规模复制受版权保护的内容。
2025年9月，Anthropic 因使用受版权保护的书籍训练AI模型，以15亿美元和解集体诉讼，赔偿书籍作者。

这些案例反映了AI行业在数据使用上的普遍困境：训练大型语言模型需要海量文本数据，但获取合法授权成本高昂且复杂。出版商则担忧其内容被无偿使用，损害自身利益。

未来影响与不确定性

此案可能对AI开发和内容产业产生深远影响：

法律界定：法院如何裁定AI“记忆”与合理使用的界限，将设定重要先例。
行业实践：AI公司可能需要调整数据采集策略，加强授权合作或开发新技术减少直接复制。
商业模式：出版商或探索与AI公司的授权协议，但具体条款和公平性仍是挑战。

目前，OpenAI尚未公开回应此诉讼，案件进展有待观察。随着生成式AI的普及，这类版权纠纷预计将持续，推动相关法律和行业标准的演变。

大英百科全书起诉OpenAI：指控ChatGPT“记忆”其受版权保护内容

大英百科全书与OpenAI的版权之战

核心指控：未经授权的“记忆”与复制

对传统出版业的冲击

行业背景：AI训练数据的版权争议

未来影响与不确定性

延伸阅读

相关资讯