• 约 300 万张 OkCupid 用户照片及相关 AI 模型已被删除。

• 此案源于 2014 年的一次数据传输,后来受到美国联邦贸易委员会(FTC)的审查。



发生了什么

Clarifai 确认已删除约 300 万张 OkCupid 用户照片及利用这些数据训练的人脸识别模型。此举是在监管审查之后进行的,该审查涉及美国联邦贸易委员会(FTC)针对约会平台所有者 Match Group 的一起案件。

这些数据最初于 2014 年传输,当时 OkCupid 与 Clarifai 共享用户图像及相关个人资料信息,用于 AI 研究。该数据集后来被用来训练人脸识别系统。

FTC 的调查重点是用户是否充分知晓其个人资料照片可能被重新用于 AI 训练。监管机构得出结论,根据消费者保护规则,披露和同意框架不充分。

在 2026 年早些时候达成和解后,Clarifai表示已于 4 月认证删除了该数据集及衍生模型。该公司还表示未将数据重新分发给外部各方。

该案件最初通过报道进入公众视野,后来升级为正式的监管审查,最终将该数据集从活跃系统中移除。

另请阅读:大型科技公司锁定核能以维持 AI 增长

为何重要

此案不仅关乎被删除的图像。它暴露了 AI 发展中更深层次的结构性问题:数据重用很少有一个明确的失效日期。

在一个监管时代收集的数据集可能会在另一个时代引发责任。曾经被视为“研究输入”的内容,如今在更严格的知情同意和透明度期望下被评估。

它还凸显了 AI 训练实践与隐私执法时间表之间日益扩大的差距。许多 AI 系统建立在早于当前治理标准的遗留数据集上。然而,监管机构越来越倾向于追溯性地应用现代合规规则。

一个更微妙的问题是问责碎片化。原始数据来自一个消费者平台,而 AI 训练和模型开发却在别处进行。这种分离使得在同意标准被违反时难以明确责任。

从更广阔的视角来看,此案反映了 AI 监管是如何通过执法而非设计来演变的。当局不是预先设定数据使用的技术限制,而是越来越依赖事后删除与和解。

这种做法可以纠正特定的违规行为,但对防止行业中其他地方的类似做法却作用甚微。随着 AI 模型对数据的渴求日益增长,风险在于合规变得被动而非结构化。

最终,Clarifai 案标志着一种转变:历史数据集不再是中性资产,而是潜在监管负债,可能在部署多年后被重新追查。

另请阅读:英国电信服务器暴露敏感配置数据