• Las empresas de IA han sido criticadas por su uso desenfrenado de contenido “públicamente disponible” para entrenar sus modelos, ya que gran parte de lo que está disponible públicamente en línea todavía está sujeto a derechos de autor.
  • OpenAI ya ha extraído y utilizado todo el contenido que alguna vez estuvo disponible públicamente en Tumblr.
  • Los críticos han expresado su preocupación por la posible infracción de los derechos de autor y la necesidad de un consentimiento explícito de los usuarios en dichas transacciones.

La reciente revelación de que OpenAI y el generador de imágenes Midjourney están a punto de finalizar un acuerdo para utilizar datos públicos de Tumblr para el entrenamiento de modelos de IA ha despertado tanto interés como preocupación en la industria.

Desafíos en torno a la privacidad del usuario y la propiedad del contenido

Según documentos internos revisados por 404 Media, la empresa matriz de Tumblr, Automattic, está supuestamente en conversaciones para vender contenido público de Tumblr a estos gigantes de la IA. Si bien los detalles específicos de los datos que se venderán no se han revelado, surgen preguntas sobre el posible impacto en la privacidad del usuario y la propiedad del contenido.

Las implicaciones éticas de utilizar contenido público generado por usuarios para el entrenamiento de IA han sido un tema de debate. Los críticos han manifestado su preocupación por la posible infracción de los derechos de autor y la necesidad de un consentimiento explícito de los usuarios en dichas transacciones. Este acontecimiento sirve como recordatorio de la compleja relación entre las plataformas de contenido generado por usuarios y el uso de dichos datos por parte de terceros.

Lea también: Tumblr elimina Post Plus y con él todo el contenido de pago a partir de enero de 2024

Empoderar y servir a los usuarios

En respuesta a las consultas sobre el posible impacto del acuerdo en el contenido de Tumblr, Automattic se mantuvo hermética, dejando a los usuarios y observadores de la industria en busca de claridad al respecto. La falta de transparencia sobre la naturaleza y el alcance de la venta de datos no ha hecho más que aumentar las aprensiones de los usuarios sobre la privacidad y seguridad de su contenido.

En medio de estos acontecimientos, es crucial que los usuarios conozcan sus derechos y opciones. Automattic ha enfatizado la importancia de la elección del usuario y ha proporcionado orientación sobre cómo optar por no compartir contenido público de Tumblr con terceros. Sin embargo, el proceso de exclusión puede requerir que los usuarios naveguen por la configuración en los navegadores web en lugar de la aplicación de Tumblr, lo que destaca la necesidad de controles de privacidad claros y accesibles.

Lea también: El regreso de Tumblr, antes Twitter

Tendencia de las empresas de IA de acceder a contenido público

Además, la cuestión de los datos existentes compartidos con socios externos ha cobrado relevancia. Andrew Spittle, líder de IA en Automattic, aseguró que se harían esfuerzos para notificar y solicitar la eliminación de datos de los socios de acuerdo con las preferencias de los usuarios. Este compromiso con el diálogo continuo y la eliminación de contenido refleja el panorama cambiante de la privacidad de los datos y el empoderamiento de los usuarios.

Este acontecimiento también arroja luz sobre la tendencia más amplia de las empresas de IA que buscan acceder a contenido público con fines de entrenamiento. Con la búsqueda por parte de OpenAI de licencias de noticias de fuentes acreditadas y la colaboración de Reddit con Google para la monetización de contenido, la comercialización de conjuntos de datos públicos se está volviendo cada vez más frecuente. A medida que las empresas tecnológicas exploran nuevas vías para la utilización de datos, las implicaciones para la privacidad del usuario y el control sobre su propio contenido siguen siendo primordiales.