- Le Voice Engine d’OpenAI utilise la technologie de synthèse vocale de l’API et de ChatGPTpour créer des voix émotives et réalistes, avec des informations préliminaires partagées à partir d'un aperçu à petite échelle.
- Le Voice Engine d’OpenAI, salué pour ses capacités de traduction linguistique, est publié avec prudence en raison de préoccupations concernant les abus potentiels et l'utilisation abusive de voix synthétiques.
- OpenAI plaide pour un déploiement responsable des voix synthétiques, citant l'incident récent où Steve Kramer a cloné la voix du président Biden pour influencer la prise de décision.
OpenAI a dévoilé Voice Engine, un outil de clonage audio basé sur l'IA, malgré son potentiel pour l'aide à la lecture et la reconnaissance vocale. L'entreprise s'inquiète des abus potentiels et s'engage à développer une IA sûre et bénéfique.
Capacités technologiques de pointe
Le Voice Engine d’OpenAI utilise son API de synthèse vocale et la technologie vocale de ChatGPT pour cloner une voix, en utilisant un échantillon de 15 secondes pour créer des voix émotives et réalistes, contrairement aux méthodes de lecture traditionnelles qui nécessitent le ton et l'inflexion d'un inconnu.
L'entreprise a publié des informations préliminaires et des résultats d'un aperçu à petite échelle de son modèle Voice Engine, qui utilise une entrée textuelle et un échantillon audio de 15 secondes pour générer une parole au son naturel.
Les données d'entraînement du Voice Engine sont floues, ce qui suscite des inquiétudes pour les entreprises d'IA accusées de violations des droits d'auteur. OpenAI revendique l'usage loyal, mais les titulaires de droits intentent des poursuites pour une compensation impayée.
À lire également:Google.org lance un accélérateur d'IA générative pour les associations à but non lucratif
À lire également:Qui est Jensen Huang? Le fondateur du fabricant de puces Nvidia était un « fauteur de troubles » avant de devenir un nom de premier plan dans l'IA
L'arme à double tranchant d'OpenAI
Le Voice Engine d’OpenAI, qui permet aux utilisateurs de changer la langue d'un locuteur, a été salué pour ses clips audio impressionnants et ses capacités de traduction linguistique. Cependant, l'entreprise adopte une approche prudente quant à une diffusion plus large en raison du potentiel d'utilisation abusive des voix synthétiques. OpenAI, qui a lancé ChatGPT publiquement fin 2022, est devenue une entité massive, et sa diffusion pourrait potentiellement exposer à de nouveaux abus.
OpenAI vise à discuter du déploiement responsable des voix synthétiques et de la manière dont la société peut s'adapter à ces nouvelles capacités. Dans un incident récent, Steve Kramer a cloné la voix du président Joe Biden pour créer un message de publipostage vocal exhortant les gens à ne pas voter lors de la primaire du New Hampshire. OpenAI prévoit de prendre des décisions éclairées basées sur des conversations et des tests à petite échelle, dans le but de créer une compréhension plus éclairée du potentiel de la technologie.
La dernière escroquerie cryptographique utilise de vrais acteurs engagés sur Fiverr pour lire un script, présentant l'escroquerie comme authentique. Cela met en évidence les dangers potentiels de l'utilisation de fausses voix générées par l'IA dans les escroqueries, car les escrocs exploiteront toujours les outils émergents pour soutirer de l'argent aux gens.