Les modèles d'IA entraînés sur YouTube par Google et OpenAI sont profilés par BTW Media car des preuves publiées les lient à l'infrastructure Internet, à la gouvernance, aux dépendances opérationnelles ou à la visibilité du marché.
Les modèles d'IA entraînés sur YouTube par Google et OpenAI sont suivis en tant qu'institution d'infrastructure Internet au sein de l'écosystème de l'infrastructure Internet.
Les modèles d'IA entraînés sur YouTube par Google et OpenAI ont une pertinence de source publique pour les opérations de réseau, la gouvernance, la cartographie des dépendances ou la structure du marché.
Les modèles d'IA entraînés sur YouTube par Google et OpenAI sont suivis en tant qu'institution d'infrastructure Internet au sein de l'écosystème de l'infrastructure Internet.
Marché cadre les preuves de ce dossier.
OpenAI et Google se sont tournés vers la transcription de vidéos YouTube pour perfectionner leurs modèles d'IA, risquant d'enfreindre les droits d'auteur. OpenAI a utilisé Whisper pour transcrire plus d'un million d'heures de vidéos, tandis que Google a également transcrit des vidéos, soulevant des questions de violation de ses propres règles.
Modèles d'IA entraînés sur des vidéos YouTube par Google et OpenAI porte un impact Moyen dans ce dossier.
Plusieurs sources publiques
- OpenAI et Google ont utilisé l'outil de reconnaissance vocale Whisper pour transcrire plus d'un million de vidéos YouTube afin d'entraîner leurs modèles d'IA.
- L'utilisation par OpenAI de vidéos YouTube pourraitenfreindre les règles de Google, qui interdisent l'utilisation de ses vidéos pour des applications autonomes ainsi que l'accès par des moyens automatisés.
OpenAI et Google se sont tournés vers la transcription de vidéos YouTube pour perfectionner leurs modèles d'IA, ce qui pourrait porter atteinte aux droits d'auteur des créateurs. Les deux géants de la technologie ont pris des raccourcis avec Meta pour obtenir autant de données que possible pour entraîner leurs modèles d'IA.
Violation du droit d'auteur des créateurs de vidéos
OpenAI a utilisé Whisper pour transcrire plus d'un million d'heures de vidéos YouTube, en intégrant les transcriptions dans GPT-4, le système d'IA utilisé pour le chatbot ChatGPT. Google, propriétaire de YouTube, a également transcrit des vidéos pour l'entraînement de modèles d'IA.
Les transcriptions de vidéos par les deux entreprises peuvent violer les droits d'auteur des producteurs originaux. Des poursuites judiciaires liées au droit d'auteur et aux licences ont résulté d'autres utilisations de contenu créatif pour l'entraînement de l'IA.
L'utilisation par OpenAI de vidéos YouTube peut également violer les règles de Google interdisant l'utilisation de ses vidéos pour des applications « indépendantes » et l'accès par « moyens automatisés (tels que les robots, les botnets ou les scrapers) » à ses vidéos.
À lire également:Des chercheurs de Google et de Stanford lancent un outil de vérification des faits par IA
À lire également:Le PDG de Google DeepMind, Demis Hassabis, reçoit le titre de chevalier pour la technologie de l'IA
Permettre l'utilisation de l'IA avec des données publiques
Le New York Times a été informé par le porte-parole de Google, Matt Bryant, que l'entreprise n'était pas au courant d'une telle utilisation par OpenAI. Des employés de Google étaient conscients de l'utilisation illégale par OpenAI du contenu de YouTube, mais ils ont choisi de ne pas intervenir car Google agissait de manière similaire. En outre, Google a informé le journal qu'il n'utilisait que du contenu dont les créateurs avaient consenti à ce type d'utilisation de leurs vidéos pour entraîner l'IA.
En juillet 2023, Google a modifié ses conditions d'utilisation pour permettre l'utilisation de contenus librement accessibles en ligne, tels que Google Docs et les évaluations de restaurants sur Google Maps, dans le but de perfectionner ses modèles d'IA.
Brief signal
- Signal: Modèles d'IA entraînés sur des vidéos YouTube par Google et OpenAI
- Type de signal: Sujet associé
- Région: Monde
- Classe de marché: Tendances services cloud mondiales
Surface opérationnelle
- Les sources publiées doivent identifier les parties touchées, la surface opérationnelle et l'exposition de marché avant que cette carte de tendance soit considérée comme complète.
Contexte de marché
- Pertinence opérationnelle: Moyen
- Horizon: Prochain trimestre
À surveiller
- Surveiller les déclarations officielles, les évolutions réglementaires, l'exposition clients ou partenaires et les publications de suivi.
Briefing membre
Contexte de tendance approfondi
Connectez-vous avec le bon niveau d'adhésion pour débloquer le briefing complet et les notes de source.
Réservé au Cercle stratégique
Cercle stratégique
Ouvert à tous les lecteurs. Débloquez les briefings de tendance après adhésion et connexion.
Rejoindre le Cercle stratégiqueRéservé à l'Alliance de leadership
Alliance de leadership
Pour les opérateurs, investisseurs et équipes politiques qui ont besoin de preuves relationnelles, de scénarios d'échec et de notes de source. Connectez-vous pour débloquer.
Rejoindre l'Alliance de leadership
