• Environ 3 millions de photos d'utilisateurs OkCupid et les modèles d'IA associés ont été supprimés.
• L'affaire découle d'un transfert de données en 2014 examiné ultérieurement par la FTC américaine.
Ce qui s'est passé
Clarifai a confirmé avoir supprimé environ 3 millions de photos d'utilisateurs OkCupid ainsi que les modèles de reconnaissance faciale entraînés sur celles-ci. Cette action fait suite à un examen réglementaire lié à une affaire de la Commission fédérale du commerce des États-Unis (FTC) impliquant le propriétaire de la plateforme de rencontres Match Group.
Les données ont été transférées à l'origine en 2014, lorsque OkCupid a partagé des images d'utilisateurs et des informations de profil associées avec Clarifai à des fins de recherche en IA. L'ensemble de données a ensuite été utilisé pour entraîner des systèmes de reconnaissance faciale.
L'enquête de la FTC s'est concentrée sur la question de savoir si les utilisateurs avaient été suffisamment informés que leurs photos de profil pouvaient être réutilisées pour l'entraînement de l'IA. Les régulateurs ont conclu que le cadre de divulgation et de consentement était insuffisant au regard des règles de protection des consommateurs.
À la suite d'un accord conclu plus tôt en 2026, Clarifai a déclaré avoir certifié la suppression à la fois de l'ensemble de données et des modèles dérivés en avril. L'entreprise a également affirmé ne pas avoir redistribué les données à des tiers.
L'affaire a d'abord été portée à l'attention du public par des signalements, puis a été soumise à un examen réglementaire formel, aboutissant au retrait de l'ensemble de données des systèmes actifs.
À lire également: Big Tech sécurise l'énergie nucléaire pour soutenir la croissance de l'IA
Pourquoi c'est important
Cette affaire ne se limite pas à la suppression d'images. Elle révèle un problème structurel plus profond dans le développement de l'IA: la réutilisation des données a rarement une date d'expiration claire.
Les ensembles de données collectés à une époque réglementaire donnée peuvent devenir des sources de responsabilité à une autre. Ce qui était autrefois considéré comme un "apport de recherche" est désormais évalué selon des attentes plus strictes en matière de consentement éclairé et de transparence.
Elle met également en évidence un écart croissant entre les pratiques d'entraînement de l'IA et les délais d'application des lois sur la protection de la vie privée. De nombreux systèmes d'IA sont construits sur des ensembles de données hérités qui sont antérieurs aux normes de gouvernance actuelles. Pourtant, les régulateurs sont de plus en plus disposés à appliquer rétroactivement les règles de conformité modernes.
Un problème plus subtil est la fragmentation de la responsabilité. Les données originales provenaient d'une plateforme grand public, tandis que l'entraînement de l'IA et le développement des modèles se sont déroulés ailleurs. Cette séparation rend difficile l'attribution claire des responsabilités lorsque les normes de consentement sont violées.
D'un point de vue plus large, l'affaire montre comment la réglementation de l'IA évolue par le biais de l'application des règles plutôt que par la conception. Au lieu de fixer des limites techniques initiales à l'utilisation des données, les autorités s'appuient de plus en plus sur des suppressions et des règlements a posteriori.
Cette approche peut corriger des violations spécifiques, mais elle ne fait pas grand-chose pour empêcher des pratiques similaires ailleurs dans l'industrie. À mesure que les modèles d'IA deviennent plus gourmands en données, le risque est que la conformité devienne réactive plutôt que structurelle.
En fin de compte, l'affaire Clarifai signale un changement: les ensembles de données historiques ne sont plus des actifs neutres, mais des passifs réglementaires potentiels qui peuvent être rouverts des années après leur déploiement.
À lire également: Des serveurs télécoms britanniques exposent des données de configuration sensibles

