• Voice Engine, une plateforme de synthèse vocale développée par OpenAI, offre la possibilité de créer des voix synthétiques.
  • Les utilisations contraires à l'éthique de la technologie vocale de l'IA pourraient entraîner des spams et susciter des inquiétudes.

Le modèle de clonage vocal Voice Engine est en développement depuis fin 2022 et peut générer une voix synthétique à partir d'un extrait de 15 secondes de la voix d'une personne. Cependant, à mesure que l'IA générative progresse, les préoccupations éthiques s'ensuivent également.

OpenAI présente Voice Engine

OpenAI a dévoilé Voice Engine, une plateforme de synthèse vocale capable de créer des voix synthétiques à partir de courts extraits vocaux.

À lire aussi: L'outil de clonage vocal d'OpenAI imite votre voix avec un échantillon de 15 secondes

Cette technologie innovante peut produire des voix générées par l'IA qui lisent des invites textuelles dans plusieurs langues, offrant des applications potentielles dans divers secteurs.

Un accès limité à Voice Engine a été accordé à certaines entreprises, notamment Age of Learning, HeyGen, Dimagi, Livox et Lifespan.

L'approche éthique d'OpenAI

Le mois dernier, après que des personnes ont reçu des appels automatisés utilisant une voix clonée par l'IA du président Joe Biden, la Federal Communications Commission (FCC) a interdit les appels automatisés.

Pour répondre à ces préoccupations, OpenAI met en place des directives éthiques concernant la technologie vocale de l'IA. Les partenaires doivent respecter des politiques d'utilisation interdisant l'usurpation d'identité sans consentement, obtenir le consentement explicite du locuteur et informer les auditeurs que la voix est générée par l'IA.

OpenAI implémente également un filigranage pour tracer l'origine de l'audio et surveille activement son utilisation. Cette initiative s'inscrit dans un effort plus large visant à atténuer les risques liés à l'IA, notamment l'abandon progressif de l'authentification vocale, la mise en œuvre de politiques pour protéger les voix des individus, le renforcement de l'éducation sur les hypertrucages (deepfakes) et le développement de systèmes de suivi du contenu généré par l'IA.