• Automattic está cerca de finalizar un acuerdo para proporcionar datos para entrenar los modelos de las empresas de IA.
  • Los acuerdos de entrenamiento de datos de IA se han convertido en una oportunidad lucrativa para los sitios web que luchan por mantenerse a flote en el resbaladizo panorama actual de la publicación en línea.

TumblryWordPress.comestán a punto de cerrar acuerdos para vender datos de usuarios a las empresas de inteligencia artificialOpenAIyMidjourney. Según informes de 404 Media, Automattic, la empresa matriz de ambas plataformas, está cerca de finalizar un acuerdo para proporcionar datos para entrenar los modelos de las empresas de IA.

La naturaleza turbia de los datos en el acuerdo

La naturaleza exacta de los datos que se incluirán en el acuerdo sigue sin estar clara, pero una supuesta comunicación interna del gerente de producto de Tumblr, Cyle Gage, ha suscitado preocupaciones sobre el alcance de los datos que se están preparando para su transferencia. El informe indica que los datos podrían haber incluido información privada o relacionada con socios que no estaba prevista para ser parte del acuerdo. Supuestamente, esto incluía publicaciones privadas en entradas de blogs públicos, blogs eliminados o suspendidos, preguntas sin respuesta, respuestas privadas, contenido explícito y material de blogs de socios premium.

Lea también:OpenAI cura la ‘pereza’ de GPT-4 con nuevas actualizaciones

Respuesta y compromiso de Automattic

Cuando se le pidió un comentario, Automattic respondió con un comunicado publicado, enfatizando que solo se compartirá el contenido público alojado en WordPress.com y Tumblr de sitios que no hayan optado por excluirse. La compañía también destacó su compromiso de respetar todas las configuraciones de exclusión voluntaria y anunció planes para lanzar una nueva herramienta de exclusión destinada a permitir a los usuarios bloquear a terceros, incluidas las empresas de IA, para que no entrenen con sus datos.

Abogando por la eliminación de los datos de los usuarios

Un supuesto documento interno de preguntas frecuentes preparado por Automattic para la nueva herramienta de exclusión sugiere que la compañía abogará activamente por la eliminación de datos a solicitud de los usuarios. Si bien el lenguaje utilizado en el documento para describir este proceso como “solicitar” y “abogar” puede llamar la atención, Andrew Spittle, jefe de IA de Automattic, ha expresado confianza en que las empresas de IA respetarán estas solicitudes basándose en conversaciones previas.

Lea también:El CEO de OpenAI, Sam Altman, y el presidente de la Cámara de EE. UU. navegan los desafíos de la regulación de la IA en el Capitolio

Desafíos enfrentados por Tumblr y WordPress.com

El contexto de estos posibles acuerdos es el panorama de la publicación en línea en rápida evolución, donde los sitios web buscan nuevas fuentes de ingresos para mantenerse a flote. Tumblr, en particular, ha enfrentado su parte de desafíos, según se informa, reduciendo su personal al mínimo a finales de 2023. Este contexto subraya la importancia de tales acuerdos de datos para plataformas como Tumblr y WordPress.com.

En un contexto industrial más amplio, esta noticia se suma a la creciente tendencia de las empresas de IA de buscar aprovechar el contenido generado por los usuarios para entrenar sus modelos. Recientemente, Google llegó a un acuerdo con Reddit, y OpenAI ha estado buscando activamente asociaciones para recopilar conjuntos de datos para el entrenamiento de modelos de IA.