Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas
Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas est suivi en tant qu'institution de l'infrastructure internet au sein de l'écosystème de l'infrastructure internet.
Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas est suivi en tant qu'institution de l'infrastructure internet au sein de l'écosystème de l'infrastructure internet.
Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas a une pertinence de source publique pour les opérations de réseau, la gouvernance, la cartographie des dépendances ou la structure du marché.
Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas est suivi en tant qu'institution de l'infrastructure internet au sein de l'écosystème de l'infrastructure internet.
Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas est suivi en tant qu'institution de l'infrastructure internet au sein de l'écosystème de l'infrastructure internet.
Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas est profilé par BTW Media parce que des preuves publiées le relient à l'infrastructure internet, à la gouvernance, aux dépendances opérationnelles ou à la visibilité du marché.
Les signaux de source publique soutiennent une surveillance à impact moyen pour la visibilité de l'infrastructure et l'analyse des dépendances.
Confiance
i
Confiance limitée (80%)
Plusieurs sources publiques
Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas est profilé par BTW Media parce que des preuves publiées le relient à l'infrastructure internet, à la gouvernance, aux dépendances opérationnelles ou à la visibilité du marché.
Une interview avec Steve Jobs a récemment été diffusée, ou du moins une réincarnation de sa voix, montrant les progrès du doublage par IA.
Le doublage par IA peut réduire les risques, les coûts et améliorer la productivité des entreprises, mais il soulève également des controverses et des défis éthiques et réglementaires.
L'avenir du doublage doit trouver un équilibre entre la technologie et l'essence de la performance humaine.
L'intersection de l'IA et des pratiques traditionnelles dans l'industrie du divertissement a suscité des débats sur l'avenir du doublage. Cependant, des inquiétudes persistent quant au système de rachat des voix et à la capacité de l'IA à transmettre le ton et les émotions humaines.
Le doublage IA a fait son entrée sur le marché
Partout dans le monde, il est indéniable que le doublage IA commence à faire des vagues sur le marché, de nombreuses entreprises réalisant même des bénéfices décents. Parmi les principaux fournisseurs du secteur figurent PlayHT, Captions et Rask AI.
Cette année, le premier épisode d'un podcast appeléPodcast.aimettait en scène l'animateur discutant de ses années universitaires, de ses opinions sur les ordinateurs, de son statut professionnel et de ses convictions, entre autres, avecSteve Jobs, le fondateur d'Apple Group.
Le podcast, qui fait revenir Jobs d'entre les morts, ressemble beaucoup à la voix et à l'intonation de Jobs, selon PlayHT, qui travaille sur une technologie de clonage vocal permettant aux particuliers et aux entreprises de créer du contenu audio à grande échelle. Le 23 novembre, ils ont publié un modèle d'IA vocale appeléOn-Premise. Ils affirment qu'il s'agit de l'outil de génération vocale offrant la latence la plus faible, la sécurité la plus élevée et une disponibilité illimitée par rapport à tous les modèles actuels.
Mahmoud Felfel, fondateur de PlayHT, a déclaré: « Nous avons construit PlayHT comme une plateforme de synthèse vocale générative et de clonage vocal. Nous avons commencé par créer l'éditeur vocal le plus sophistiqué pour aider nos clients à contrôler entièrement les voix générées. Nous avons ensuite investi dans la construction du premier modèle de langage à grande échelle pour la synthèse vocale et le clonage vocal, et avons obtenu desrésultats SOTAen matière de qualité et d'expressivité vocales. »
Captions, une startup vidéo basée à New York, propose des services de sous-titrage, d'édition et d'effets spéciaux pour les créateurs de contenu sur les réseaux sociaux. Elle s'est étendue aux services de traduction en 2022 et a introduit le doublage IA en 2023. Avec des fonctionnalités innovantes comme l'AI Eye Contact et les sous-titres automatiques générés par IA, Captions compte plus de 100 000 utilisateurs quotidiens et cinq millions de créateurs. Malgré les coûts élevés de formation de l'IA, l'entreprise est rentable et a levé 40 millions de dollars de financement. Sa dernière innovation,Lipdub, a été adoptée par des entités majeures comme ESPN et le fondateur de Twitch, Justin Kan.
Rask AI, un outil de localisation vidéo et audio alimenté par l'IA, traduit le contenu dans plus de 130 langues et propose une fonction de clonage vocal. Lancé le 20 mars 2023 et ayant remporté le prix Produit du Jour sur Product Hunt début avril, il compte désormais plus de 750 000 utilisateurs dans le monde. Parmi les projets clés figurent le doublage du film français « THE LEGEND OF AKAM » en portugais pour sa sortie au Brésil. De plus, PodcastOne utilise Rask AI pour traduire sa bibliothèque de podcasts en espagnol, en commençant par le premier podcast de Barbara Schroeder, « Bad Bad Thing ».
Grâce à des processus tels que la traduction, l'adaptation culturelle, la voix off ou le doublage, Rask AI simplifie considérablement le processus de localisation de contenu vidéo, aidant les entreprises et les créateurs à produire des vidéos localisées de manière efficace et économique.
En effet, des progrès significatifs ont été réalisés dans l'application de l'IA dans le domaine du doublage, qui se concentre actuellement sur deux technologies principales. Presque tous les modèles vocaux d'IA des entreprises reposent sur la R&D de ces deux technologies de base.
La première est la technologie de conversion vocale (VC,Voice Conversion) qui permet à l'IA de convertir du texte en audio en ajustant le timbre, la hauteur, la langue et d'autres attributs tout en conservant le contenu original, mais elle ne peut pas prendre en compte les interactions à plusieurs personnes ni les expressions émotionnelles. Cette technologie est similaire à la lecture à voix haute et convient aux scénarios nécessitant uniquement un changement des caractéristiques vocales tout en conservant le contenu original.
Deuxièmement, la technologie de synthèse vocale (TTS,Text-to-Speech) est capable de convertir du texte écrit en parole interactive. Ces dernières années, la technologie TTS a réussi à montrer des expressions émotionnelles, rendant le doublage IA plus « humain » et ne donnant plus une impression mécanique froide.
Implications pour les pratiques traditionnelles de voix off
1. Améliorer l'efficacité et réduire les coûts
« En tirant parti de Rask AI, les entreprises peuvent accélérer leurs efforts de localisation, toucher un public plus large et améliorer leur reconnaissance de marque sur les marchés mondiaux. »
Maria Chmir, PDG et fondatrice de Rask AI
L'intégration de l'IA dans le doublage améliore l'efficacité du travail et réduit les coûts de production en analysant rapidement les empreintes vocales pour des répliques précises et contextuellement appropriées. Cela permet un doublage plus rapide et la création de versions en plusieurs langues, entraînant un changement de paradigme dans l'approche des sociétés de production vis-à-vis des projets de doublage.
Rikki Lee Travolta, un acteur talentueux, a déclaré: « Le plus grand avantage de l'IA en voix off, c'est le coût. Un acteur de voix syndiqué coûtera un tarif horaire. Ajoutez à cela le coût des ingénieurs et la location du studio. Avec l'IA, vous éliminez la plupart, voire la totalité, de ces coûts. »
Maria Chmir, PDG et fondatrice de Rask AI, affirme également que l'IA est un outil très pratique pour les contenus ou les entreprises qui se tournent vers l'international. « En tirant parti de Rask AI, les entreprises peuvent accélérer leurs efforts de localisation, toucher un public plus large et améliorer leur reconnaissance de marque sur les marchés mondiaux. »
2. Réduction des risques
Le doublage IA peut atténuer les risques pour les grandes entreprises, comme l'illustre le jeu « Tears of Themis » de Mihoyo. Lorsqu'un doubleur a été impliqué dans un litige,Mihoyoa utilisé la synthèse profonde pour apprendre et reproduire la voix de l'acteur à partir d'enregistrements antérieurs, permettant un doublage automatique. Cette solution a préservé l'expérience de jeu sans avoir à remplacer l'acteur ni à laisser le personnage sans voix.
3. Favoriser la diffusion à l'étranger
Le manque de synchronisation entre les mouvements des lèvres et la voix dans le contenu doublé est un inconvénient majeur, contribuant potentiellement à son impopularité dans les pays anglophones. L'IA peut être utilisée pour modifier les mouvements des lèvres d'un personnage, rendant le contenu localisé plus authentique et attrayant pour les spectateurs. Chmir a déclaré dans l'interview: « En tirant parti de Rask AI, les entreprises peuvent accélérer leurs efforts de localisation, toucher un public plus large et améliorer leur reconnaissance de marque sur les marchés mondiaux. »
4. Panique quant au remplacement des humains par l'IA
« Maintenant, nous sommes aussi effrayés que lorsque le COVID-19 est arrivé; nous ne savons pas ce qui va se passer. »
Daniel Hamvas, doubleur
L'application de l'intelligence artificielle dans la voix off ne se limite pas à une seule industrie; les entreprises explorent la possibilité d'utiliser l'IA pour synthétiser différentes répliques. Traditionnellement, les sociétés de cinéma, de télévision et de jeux vidéo sélectionnent des doubleurs appropriés des mois à l'avance, fournissent le texte et enregistrent hors ligne. Les doubleurs expérimentés sont payés en fonction du nombre de mots et du temps passé à enregistrer. Cependant, l'avènement de l'intelligence artificielle a apporté une nouvelle dynamique.
Certaines entreprises ont tendance à enregistrer les voix des doubleurs, puis à utiliser l'IA pour synthétiser des répliques supplémentaires, tandis que d'autres tentent même d'acheter les voix des doubleurs par un accord unique pour créer une propriété intellectuelle vocale appartenant exclusivement à l'entreprise.
Cela soulève des questions sur l'avenir de l'industrie de la voix off. Le célèbre doubleur Daniel Hamvas a doublé de nombreux personnages dans des contenus hongrois au fil des ans et est désormais le chef du syndicat des travailleurs du doublage hongrois.Il est en première ligne de la lutte, s'opposant fermement à l'utilisation du doublage IA pour protéger les professionnels dont les moyens de subsistance sont menacés par l'automatisation. Hamvas a exprimé leurs inquiétudes en déclarant: « Maintenant, nous sommes aussi effrayés que lorsque le COVID-19 est arrivé; nous ne savons pas ce qui va se passer. »
Défis et controverses
« Aucune quantité d'algorithmes ne peut créer les imperfections qui rendent une performance humaine parfaite. L'IA peut faire une bonne imitation, mais un imitateur d'Elvis ne sera jamais Elvis. »
Rikki Lee Travolta, acteur talentueux
Malgré les progrès de l'IA, elle peut avoir du mal à capturer la profondeur et l'authenticité que les acteurs humains apportent à leurs performances. Le risque que le doublage perde la touche humaine suscite des inquiétudes quant à l'engagement du public et à l'expérience visuelle globale.
Phil Siegel, fondateur de l'organisation à but non lucratif en IACAPTRS, a affirmé: « Les modèles sont capables d'identifier les tonalités caractéristiques de la voix; ils peuvent le faire avec très peu de données, mais si vous lui fournissez plusieurs phrases d'une voix, il serait probablement capable de produire une voix que la plupart des gens ne pourraient pas distinguer de la personne réelle. »
Travolta souligne également que l'IA ne peut pas remplacer les humains après tout. « Et je m'attends à ce que l'IA continue de progresser. Mais elle ne sera jamais humaine. Aucune quantité d'algorithmes ne peut créer les imperfections qui rendent une performance humaine parfaite. L'IA peut faire une bonne imitation, mais un imitateur d'Elvis ne sera jamais Elvis. », a déclaré Travolta.
Protection des droits d'auteur sur les voix
« La réglementation la plus importante, au-delà des questions juridiques et éthiques mentionnées, est qu'il y a un consensus croissant sur le fait que le contenu généré par l'IA doit être identifié comme tel. À la fois les outils utilisés et les intrants de "matière première". »
Phil Siegel, fondateur de l'organisation à but non lucratif en IACAPTRS
La manière dont le doublage IA aborde les problèmes éthiques et juridiques potentiels dans la modélisation reste une énigme. La plupart des entreprises assurent actuellement la conformité et la sécurité de la capture vocale. Les machines ne peuvent reproduire que le texte qui a été lu par des personnes en personne, ce qui nécessite également l'autorisation de la personne elle-même. Siegel souligne également l'importance du filigrane: « La réglementation la plus importante, au-delà des questions juridiques et éthiques mentionnées, est qu'il y a un consensus croissant sur le fait que le contenu généré par l'IA doit être identifié comme tel.
À la fois les outils utilisés et les intrants de "matière première". Ainsi, doubler la voix de Taylor Swift avec Speechify aurait un filigrane d'identification spécifique. »
Malheureusement, jusqu'à présent, il existe une lacune dans la protection juridique en matière de droits d'auteur sur les sons générés par IA. La définition de la contrefaçon sonore est également très vague. Certains professionnels du son sont désormais conscients de la valeur du son, mais les gens ordinaires utilisant des logiciels fatigués sont-ils conscients des risques liés aux licences sonores?
« Parce que la plupart des législations actuelles sont en réalité basées sur une peur irrationnelle, et nous sommes une industrie qui doit avant tout se réguler elle-même. »
Maria Chmir, PDG et fondatrice de Rask AI
En tant que développeur de produits de doublage IA, Chmir a également exprimé son attitude: « Nous nous engageons à travailler avec les entreprises médiatiques, les gouvernements et les institutions de recherche en IA pour sensibiliser et établir des normes éthiques autour de l'authenticité du contenu en IA. » Donc nous n'en sommes qu'au tout début, et il est vraiment important d'être transparent sur ce qui se passe. Parce que la plupart des législations actuelles sont en réalité basées sur une peur irrationnelle, et nous sommes une industrie qui doit avant tout se réguler elle-même.
Nos produits rendent la technologie IA accessible aux créateurs tout en limitant le potentiel d'utilisation irresponsable.
Facteurs humains dans le doublage
doublage
La voix off est bien plus qu'un simple processus technique. C'est une forme d'art qui repose sur la capacité d'un acteur à transmettre efficacement l'émotion et les nuances. Les acteurs humains apportent une profondeur d'expérience et une compréhension culturelle uniques à leurs performances, leur permettant de s'adapter aux nuances des différents personnages et scènes. Bien que l'IA puisse imiter les schémas de parole humaine, la question demeure de savoir si elle peut véritablement reproduire la profondeur émotionnelle et la connexion qu'un acteur humain établit avec le public.
L'avenir de la voix off: trouver l'équilibre
Alors que l'industrie intègre l'IA dans les pratiques de voix off, trouver un équilibre entre l'innovation technologique et la préservation de l'essence de la performance humaine devient essentiel. La collaboration entre l'IA et les doubleurs humains pourrait offrir un terrain d'entente où l'efficacité de l'IA complète les performances nuancées des acteurs humains. Cette approche hybride accélérerait non seulement le processus de doublage, mais garantirait également que la résonance émotionnelle et les différences culturelles ne soient pas sacrifiées au profit de l'efficacité.
« Certains experts pensent que le doublage IA pourrait remplacer tout le monde dans l'industrie, bien que ce soit loin de la réalité. Il est plus juste d'appeler l'étape actuelle de co-création », a également déclaré Chmir.
Domaine d'activité
Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas est lu à partir de son rôle public, de son contexte opérationnel et de la couverture liée.
Rôle public: Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas est suivi à travers son rôle visible, son contexte de service et des éléments vérifiables. Base de preuve: Plusieurs sources publiques
Surface opérationnelle: Gouvernance et Sujet associé donnent le contexte public de ce profil de institution. Base de preuve: Plusieurs sources publiques
Chronologie
Profil public de Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas mis à jour
La couverture publique inscrit Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas comme sujet à suivre par rôle, contexte opérationnel et preuves.
En bref
Nom: Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas
Type: Sujet associé
Base: Sujet associé
Axe du profil: Institution publique
Ce que cela fait
Les documents publics permettent de suivre son rôle, ses services et ses relations clés.
Pourquoi c'est important
Les signaux de source publique soutiennent une surveillance à impact moyen pour la visibilité de l'infrastructure et l'analyse des dépendances.
Criticité opérationnelle: Moyen
Horizon: Prochain trimestre
À surveiller
Le suivi porte sur la continuité de service vérifiée, les changements de gouvernance et les signaux relationnels.
MaintenantMoyen prioritaire
Suivre les mises à jour de sources vérifiées, les changements de rôle et les preuves publiques actuelles.
TrimestreMoyen sensibilité politique
Les signaux de source publique soutiennent une surveillance à impact moyen pour la visibilité de l'infrastructure et l'analyse des dépendances.
AnnéeProchain trimestre perspective
La pertinence de long terme dépend de changements vérifiés dans l'exploitation, les politiques et les relations.
Briefing membre
Contexte de profil approfondi
Connectez-vous avec le bon niveau d'adhésion pour débloquer le briefing complet et les notes de source.
Réservé au Cercle stratégique
Cercle stratégique
Ouvert à tous les lecteurs. Débloquez les briefings de profil après adhésion et connexion.
La lecture publique de Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas reste limitée au rôle visible, au contexte opérationnel et aux relations étayées.
Points de vigilance
Nouveaux rôles, partenariats, produits, politiques ou signaux de marché publics.
Changements relationnels vérifiés impliquant des organisations ou personnes nommées.
Réserves
Les affirmations privées ou non vérifiées sont exclues de cette vue publique.
Questions fréquentes
Pourquoi Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas est-il inclus ?
Envie d'interviewer un mort? Le doublage IA le rend possible, mais tout le monde n'apprécie pas dispose de preuves publiques qui le rendent pertinent pour la couverture des infrastructures numériques, de la gouvernance ou des marchés.
Qu'est-ce qui est public dans ce profil ?
La couche publique couvre le rôle visible, le contexte opérationnel, les entités liées et les points de vigilance étayés.
Que faut-il surveiller ensuite ?
Les lecteurs doivent suivre les changements de rôle, nouveaux partenariats, expositions réglementaires, extensions opérationnelles ou preuves capables de modifier l'évaluation publique.