• OpenAI y Google utilizaron la herramienta de reconocimiento de voz Whisper para transcribir más de 1 millón de videos de YouTube para entrenar sus modelos de IA.
  • El uso de videos de YouTube por parte de OpenAI puedeviolar las reglas de Google, que prohíben el uso de sus videos para aplicaciones independientes, así como el acceso mediante medios automatizados.

Tanto OpenAI como Google han recurrido a transcribir videos de YouTube para entrenar aún más sus modelos de IA, lo que podría infringir los derechos de autor de los creadores. Los dos gigantes tecnológicos tomaron atajos en Meta para obtener la mayor cantidad de datos posible para entrenar sus modelos de IA.

Violación de los derechos de autor de los videos de los creadores

OpenAI utilizó Whisper para transcribir más de un millón de horas de videos de YouTube, introduciendo las transcripciones en GPT-4, el sistema de IA utilizado para el chatbot ChatGPT. Google, propietario de YouTube, también transcribió videos para el entrenamiento de modelos de IA.

Las transcripciones de videos por parte de ambas empresas pueden violar los derechos de autor de los productores originales. Demandas relacionadas con derechos de autor y licencias han surgido de otros usos de contenido creativo para el entrenamiento de IA.

El uso de videos de YouTube por parte de OpenAI también puede violar las reglas de Google que prohíben el uso de sus videos para aplicaciones “independientes” y “medios automatizados (como bots, botnets o scrapers)” para acceder a sus videos.

Lea también:Google y Stanford lanzan herramienta de verificación de datos con IA

Lea también:El CEO de Google DeepMind, Demis Hassabis, recibe el título de caballero por la tecnología de IA

Permitir el uso de IA con datos públicos

The New York Times fue informado por el portavoz de Google, Matt Bryant, de que la empresa no tenía conocimiento de dicho uso por parte de OpenAI. Los empleados de Google estaban al tanto del uso ilegal de contenido de YouTube por parte de OpenAI, pero decidieron no intervenir ya que Google estaba actuando de manera similar. Además, Google informó al periódico que solo utilizó contenido cuyos creadores habían dado su consentimiento para este tipo de uso de sus videos para enseñar a la IA.

En julio de 2023, Google modificó sus términos de servicio para permitir el uso de contenido que está disponible gratuitamente en línea, como Google Docs y las calificaciones de restaurantes en Google Maps, con el fin de entrenar aún más modelos de IA.