• Alrededor de 3 millones de fotos de usuarios de OkCupid y modelos de IA relacionados fueron eliminados.

• El caso surge de una transferencia de datos de 2014 posteriormente investigada por la FTC de EE. UU.



Qué sucedió

Clarifai confirmó que eliminó aproximadamente 3 millones de fotos de usuarios de OkCupid junto con los modelos de reconocimiento facial entrenados con ellas. La acción se produjo tras un escrutinio regulatorio vinculado a un caso de la Comisión Federal de Comercio de EE. UU. (FTC) que involucra al propietario de la plataforma de citas Match Group.

Los datos fueron transferidos originalmente en 2014, cuando OkCupid compartió imágenes de usuarios e información de perfil relacionada con Clarifai con fines de investigación de IA. El conjunto de datos se utilizó posteriormente para entrenar sistemas de reconocimiento facial.

La investigación de la FTC se centró en si los usuarios habían sido informados adecuadamente de que sus fotos de perfil podrían reutilizarse para el entrenamiento de IA. Los reguladores concluyeron que el marco de divulgación y consentimiento era insuficiente según las normas de protección al consumidor.

Tras un acuerdo alcanzado a principios de 2026, Clarifai declaró que había certificado la eliminación tanto del conjunto de datos como de los modelos derivados en abril. La compañía también dijo que no había redistribuido los datos a terceros.

El caso llamó la atención pública por primera vez a través de reportajes y luego se intensificó hasta una revisión regulatoria formal, que culminó con la eliminación del conjunto de datos de los sistemas activos.

También lea: Grandes tecnológicas aseguran energía nuclear para impulsar el crecimiento de la IA

Por qué es importante

Este caso no se trata solo de imágenes eliminadas. Expone un problema estructural más profundo en el desarrollo de la IA: la reutilización de datos rara vez tiene una fecha de caducidad clara.

Los conjuntos de datos recopilados en una era regulatoria pueden convertirse en desencadenantes de responsabilidad en otra. Lo que antes se trataba como "insumo de investigación" ahora se evalúa bajo expectativas más estrictas de consentimiento informado y transparencia.

También resalta una brecha creciente entre las prácticas de entrenamiento de IA y los plazos de aplicación de las leyes de privacidad. Muchos sistemas de IA se construyen sobre conjuntos de datos heredados que son anteriores a los estándares de gobernanza actuales. Sin embargo, los reguladores están cada vez más dispuestos a aplicar normas de cumplimiento modernas de forma retroactiva.

Un problema más sutil es la fragmentación de la responsabilidad. Los datos originales provenían de una plataforma de consumidores, mientras que el entrenamiento de IA y el desarrollo del modelo ocurrieron en otro lugar. Esta separación dificulta la asignación clara de responsabilidades cuando se incumplen los estándares de consentimiento.

Desde una perspectiva más amplia, el caso refleja cómo la regulación de la IA está evolucionando a través de la aplicación en lugar del diseño. En lugar de establecer límites técnicos por adelantado sobre el uso de datos, las autoridades dependen cada vez más de eliminaciones y acuerdos posteriores.

Ese enfoque puede corregir violaciones específicas, pero hace poco para prevenir prácticas similares en otras partes de la industria. A medida que los modelos de IA se vuelven más hambrientos de datos, el riesgo es que el cumplimiento se vuelva reactivo en lugar de estructural.

En última instancia, el caso Clarifai señala un cambio: los conjuntos de datos históricos ya no son activos neutrales, sino posibles pasivos regulatorios que pueden reabrirse años después de su implementación.

También lea: Servidores de telecomunicaciones del Reino Unido exponen datos de configuración sensibles