• Les entreprises d'IA sont critiquées pour leur utilisation effrénée de contenu « publiquement disponible » pour entraîner leurs modèles, car une grande partie de ce qui est disponible en ligne est toujours soumise au droit d'auteur.
  • OpenAI a déjà récupéré et utilisé tout contenu autrefois publiquement disponible sur Tumblr.
  • Les critiques ont exprimé des inquiétudes concernant la violation potentielle du droit d'auteur et la nécessité d'un consentement explicite de l'utilisateur dans de telles transactions.

La récente révélation selon laquelle OpenAI et le générateur d'images Midjourney sont sur le point de finaliser un accord pour utiliser les données publiques de Tumblr pour l'entraînement des modèles d'IA a suscité à la fois de l'intérêt et des inquiétudes au sein du secteur.

Défis liés à la vie privée des utilisateurs et à la propriété du contenu

Selon des documents internes examinés par 404 Media, la société mère de Tumblr, Automattic, serait en pourparlers pour vendre le contenu public de Tumblr à ces géants de l'IA. Bien que les détails des données à vendre restent confidentiels, des questions se posent quant à l'impact potentiel sur la vie privée des utilisateurs et la propriété du contenu.

Les implications éthiques de l'utilisation de contenu public généré par les utilisateurs pour l'entraînement de l'IA font l'objet de débats. Les critiques ont soulevé des inquiétudes concernant la violation potentielle du droit d'auteur et la nécessité d'un consentement explicite de l'utilisateur dans de telles transactions. Ce développement rappelle la relation complexe entre les plateformes de contenu généré par les utilisateurs et l'utilisation de ces données par des entités tierces.

À lire aussi: Tumblr supprime Post Plus, et avec lui tout le contenu payant, à partir de janvier 2024

Autonomiser et servir les utilisateurs

En réponse aux questions sur l'impact potentiel de l'accord sur le contenu de Tumblr, Automattic est restée discrète, laissant les utilisateurs et les observateurs du secteur dans l'expectative. Le manque de transparence concernant la nature et la portée de la vente de données n'a fait qu'accroître les appréhensions des utilisateurs quant à la confidentialité et à la sécurité de leur contenu.

Dans ce contexte, il est crucial que les utilisateurs connaissent leurs droits et options. Automattic a souligné l'importance du choix de l'utilisateur et a fourni des conseils pour refuser le partage du contenu public de Tumblr avec des tiers. Cependant, le processus de refus peut nécessiter que les utilisateurs naviguent dans les paramètres via un navigateur Web plutôt que l'application Tumblr, ce qui souligne la nécessité de contrôles de confidentialité clairs et accessibles.

À lire aussi: Le retour de Tumblr, anciennement Twitter

Tendance des entreprises d'IA à accéder au contenu public

De plus, la question des données existantes partagées avec des partenaires tiers est mise en évidence. Andrew Spittle, responsable de l'IA chez Automattic, a assuré que des efforts seraient faits pour notifier et demander la suppression des données des partenaires conformément aux préférences des utilisateurs. Cet engagement en faveur d'un dialogue continu et de la suppression de contenu reflète l'évolution du paysage de la confidentialité des données et de l'autonomisation des utilisateurs.

Ce développement met également en lumière la tendance plus large des entreprises d'IA à chercher à accéder à du contenu public à des fins d'entraînement. Avec la quête d'OpenAI pour obtenir des licences d'articles de presse auprès de sources réputées et la collaboration de Reddit avec Google pour la monétisation du contenu, la commercialisation des ensembles de données publics devient de plus en plus répandue. Alors que les entreprises technologiques explorent de nouvelles voies d'utilisation des données, les implications pour la vie privée des utilisateurs et le contrôle de leur contenu restent primordiales.