本文的核心依据是 OpenAI 于 2024 年 2 月 26 日在《纽约时报》公司诉微软公司等一案中提交的动议。该案为两个月前在纽约南区联邦地区法院提起的版权诉讼。《纽约时报》的起诉状指控微软及多个 OpenAI 实体未经许可使用《纽约时报》的新闻报道来训练生成式 AI 系统,并声称 ChatGPT 或相关产品生成的输出可能与《纽约时报》作品竞争、总结或复制其内容。OpenAI 的动议则寻求驳回部分诉讼请求,并对《纽约时报》构建输出示例的方式提出质疑。
OpenAI 的核心公关举措是将这些示例重新界定为对抗性证据,而非正常用户行为。该动议声称,《纽约时报》需要数万次尝试、文章摘录、一个模型漏洞以及违反条款的诱导性提示,才生成起诉状中的输出。OpenAI 还辩称,ChatGPT 并非《纽约时报》订阅的替代品,普通用户无法随意调取《纽约时报》的文章,案件应聚焦于切实的版权问题,而非 OpenAI 认为人为制造的输出。
《纽约时报》的立场并不仅是报纸对训练数据的抱怨。其起诉状描述了一场商业与权利的冲突:昂贵的新闻内容被用于构建 AI 系统,输出可能复制或紧密总结受保护的作品,且存在用户无需访问或付费即获取《纽约时报》衍生信息的风险。Axios 后来报道称,《纽约时报》的律师回应表示,OpenAI 曲解了该出版商使用 OpenAI 产品寻找侵权证据的行为。
其实际操作层面的重要性在于证据纪律。若法院认定输出示例人为操纵痕迹过重,出版商可能需要更透明的测试规程和更可靠的普通用户替代证明。若法院认可这些示例的证明力,AI 提供商则须面对更严格的记忆控制、提示攻击抵御、内容许可以及训练数据披露等方面的压力。无论哪种情况,此争议都提高了将模型输出截图当作简单证据的代价。
2025 年 4 月的法院命令表明,为何该动议的重要性超越标题本身。法院限缩了部分理论,但允许重要的版权相关诉求继续推进,包括直接侵权和帮助侵权理论。这一程序背景使得 2024 年 2 月的指控仍作为更大诉讼进程的一部分具有相关性,而非任何一方在实体上获胜的定论。

