新上线20天前0 投票
大英百科全书起诉OpenAI:指控ChatGPT“记忆”其受版权保护内容
大英百科全书与OpenAI的版权之战
2026年3月16日,大英百科全书(Encyclopedia Britannica) 与词典出版商梅里亚姆-韦伯斯特(Merriam-Webster) 正式向OpenAI提起诉讼,指控其未经许可使用受版权保护的内容训练AI模型,并生成与原始内容“实质性相似”的回应。这起诉讼是近年来出版业与AI公司之间版权纠纷的最新案例,凸显了生成式AI发展中的法律与伦理挑战。
核心指控:未经授权的“记忆”与复制
根据诉讼文件,大英百科全书指出,GPT-4“记忆”了大量其受版权保护的内容,并在用户请求时输出近乎逐字复制的段落。诉讼中提供了OpenAI模型回应与大英百科全书原文的对比示例,显示整段文字几乎完全匹配。
大英百科全书声称,OpenAI反复复制其内容而未获许可,这些“记忆”的示例是用于训练GPT-4等模型的未经授权副本。这不仅涉及版权侵权,还影响了出版商的商业模式。
对传统出版业的冲击
诉讼进一步指控OpenAI通过生成与大英百科全书内容“替代或直接竞争”的回应,“蚕食”其网络流量。与传统搜索引擎不同,AI模型直接提供答案,而非引导用户访问原始网站,这可能减少出版商的广告收入和订阅转化。
行业背景:AI训练数据的版权争议
这起诉讼是出版业针对AI公司的一系列版权诉讼中的最新一起。例如:
- 《纽约时报》 在针对OpenAI的诉讼中提出了类似指控,指责其大规模复制受版权保护的内容。
- 2025年9月,Anthropic 因使用受版权保护的书籍训练AI模型,以15亿美元和解集体诉讼,赔偿书籍作者。
这些案例反映了AI行业在数据使用上的普遍困境:训练大型语言模型需要海量文本数据,但获取合法授权成本高昂且复杂。出版商则担忧其内容被无偿使用,损害自身利益。
未来影响与不确定性
此案可能对AI开发和内容产业产生深远影响:
- 法律界定:法院如何裁定AI“记忆”与合理使用的界限,将设定重要先例。
- 行业实践:AI公司可能需要调整数据采集策略,加强授权合作或开发新技术减少直接复制。
- 商业模式:出版商或探索与AI公司的授权协议,但具体条款和公平性仍是挑战。
目前,OpenAI尚未公开回应此诉讼,案件进展有待观察。随着生成式AI的普及,这类版权纠纷预计将持续,推动相关法律和行业标准的演变。