OpenAI Voice Engine: clonage vocal en 15 secondes

L'outil Voice Engine d'OpenAI imite votre voix en 15 secondes

OpenAI a dévoilé Voice Engine, une plateforme de synthèse vocale qui génère une voix synthétique à partir d'un extrait de 15 secondes. Cet outil de clonage vocal peut lire des textes dans plusieurs langues. OpenAI teste actuellement cette technologie à petite échelle pour recueillir des retours et mettre en place des mesures de sécurité, notamment le filigrane, afin d’éviter les abus tels que les deepfakes audio.

Un modèle appelé « Voice Engine » peut essentiellement dupliquer la voix de quelqu'un à partir d'un échantillon audio de 15 secondes, selon un article de blog d'OpenAI partageant les résultats d'un test à petite échelle de l'outil.
« Ces déploiements à petite échelle nous aident à affiner notre approche, nos garde-fous et notre réflexion sur la manière dont Voice Engine pourrait être utilisé à bon escient dans divers secteurs », a déclaré OpenAI dans son article de blog.
OpenAI est un outil étroitement contrôlé jusqu'à ce que des protections soient en place pour contrecarrer les faux audio destinés à tromper les auditeurs.

OpenAI a développé une plateforme de génération de texte en parole appelée Voice Engine, qui crée une parole synthétique à partir d’un extrait de voix de 15 secondes.

L'outil de clonage vocal

La parole générée par l'intelligence artificielle peut lire des invites textuelles selon des commandes dans la même langue que le locuteur ou dans plusieurs autres langues.

« Ces déploiements à petite échelle nous aident à affiner notre approche, nos garde-fous et notre réflexion sur la manière dont Voice Engine pourrait être utilisé à bon escient dans divers secteurs », a déclaré OpenAI dans son article de blog.

Dans ces échantillons publiés par OpenAI, vous pouvez entendre un contenu de narration pré-écrit, ainsi que des « réponses personnalisées en temps réel » rédigées pour GPT-4.

OpenAI a indiqué avoir commencé à développer un moteur vocal fin 2022, et la technologie fournit déjà des voix prédéfinies pour les API de synthèse vocale et la fonction de lecture à voix haute de ChatGPT.

Problèmes de sécurité

OpenAI déclare travailler avec des partenaires américains et internationaux issus des gouvernements, des médias, du divertissement, de l'éducation, de la société civile et d'autres secteurs pour intégrer leurs retours à mesure de la construction.

Les chercheurs en désinformation craignent une utilisation abusive généralisée des applications alimentées par l'IA lors d'une année électorale cruciale, en raison de la prolifération d'outils de clonage vocal bon marché, faciles à utiliser et difficiles à tracer.

OpenAI reconnaît ces problèmes et affirme qu'« en raison du potentiel d'abus de la parole synthétique, l'entreprise adopte une approche prudente et éclairée pour une diffusion plus large ».

Il y a quelques mois, un consultant politique travaillant pour la campagne présidentielle du rival démocrate de Joe Biden a admis être à l'origine d'appels téléphoniques automatisés imitant le dirigeant américain.

L'incident a alarmé les experts qui redoutent un déluge de désinformation deepfake alimentée par l'IA lors de la course à la Maison Blanche de 2024 ainsi que lors d'autres élections clés dans le monde cette année.

« Nous avons mis en place un ensemble de mesures de sécurité, notamment le filigrane pour tracer l'origine de tout audio généré par Voice Engine, ainsi qu'une surveillance proactive de son utilisation », a déclaré OpenAI.

L'outil Voice Engine d'OpenAI imite votre voix en 15 secondes

L'outil de clonage vocal

Problèmes de sécurité

Brief signal

Surface opérationnelle

Contexte de marché

À surveiller

Contexte de tendance approfondi

Cercle stratégique

Alliance de leadership

Briefing Cercle stratégique

Briefing Alliance de leadership