• OpenAI a retardé le nouveau mode vocal de ChatGPT, repoussant son lancement à courant juillet.
  • Ce retard n’affectera pas le déploiement des nouvelles fonctionnalités de partage vidéo et d’écran présentées séparément lors de l’événement presse de printemps d’OpenAI.

NOTRE AVIS
Cette décision démontre la forte concentration de l’entreprise sur la qualité des produits et l’expérience utilisateur, tout en soulignant les défis et les complexités rencontrés lors de l’introduction de nouvelles technologies. À mesure que la technologie de l’IA évolue, les décisions et stratégies d’OpenAI ont un impact profond sur l’industrie et les utilisateurs, notamment en ce qui concerne l’avancement de la technologie vocale et la garantie de la sécurité des données.

–Revel Cheng, journaliste BTW

OpenAI a retardé le nouveau mode vocal de ChatGPT, repoussant son lancement à courant juillet.

Que s’est-il passé

Dans un message publié sur le serveur Discord officiel d’OpenAI, l’entreprise indique qu’elle avait prévu de commencer à déployer une version alpha du mode vocal avancé auprès d’un petit groupe d’utilisateurs deChatGPT Plusfin juin, mais que des problèmes persistants l’ont contrainte à reporter le lancement à une date indéterminée en juillet.

En mai, lorsqu’OpenAI a présenté pour la première fois un « mode vocal avancé » étrangement réaliste et quasi instantané pour sa plateforme de chatbot basée sur l’IA, ChatGPT, l’entreprise avait annoncé que cette fonctionnalité serait déployée auprès des utilisateurs payants de ChatGPT d’ici quelques semaines.

Plusieurs mois plus tard, OpenAI annonce avoir besoin de plus de temps.

OpenAI précise que le mode vocal avancé pourrait ne pas être disponible pour tous les clients ChatGPT Plus avant l’automne, selon qu’il réussisse ou non certains contrôles internes de sécurité et de fiabilité. Ce retard n’affectera toutefois pas le déploiement des nouvelles fonctionnalités de partage vidéo et d’écran présentées séparément lors de l’événement presse de printemps d’OpenAI.

Ces fonctionnalités comprennent notamment la résolution de problèmes mathématiques à partir d’une photo du problème et l’explication de divers menus de paramètres sur un appareil. Elles sont conçues pour fonctionner sur ChatGPT aussi bien sur les smartphones que sur les clients de bureau, comme l’application pour macOS, désormais accessible à tous les utilisateurs de ChatGPT.

À lire aussi:Is Gemini AI open source? Voici ce que vous devez savoir

À lire aussi:Google dévoile Gemma, un modèle d’IA léger et ouvert

Pourquoi c’est important

Sur scène lors de l’événement de lancement, des employés d’OpenAI ont montré ChatGPT répondant presque instantanément à des requêtes telles que résoudre un problème de mathématiques sur une feuille de papier placée devant la caméra du smartphone d’un chercheur.

« Le mode vocal avancé de ChatGPT peut comprendre et répondre avec des émotions et des signaux non verbaux, nous rapprochant de conversations naturelles et en temps réel avec l’IA », écrit OpenAI. « Notre mission est de vous apporter ces nouvelles expériences de manière réfléchie. »

Le mode vocal avancé d’OpenAI a suscité une controverse en raison de la ressemblance de la voix par défaut « Sky » avec celle de l’actrice Scarlett Johansson. Johansson a ensuite publié une déclaration indiquant qu’elle avait engagé un conseiller juridique pour enquêter sur la voix et obtenir des détails précis sur son développement — et qu’elle avait refusé les sollicitations répétées d’OpenAI pour obtenir une licence sur sa voix pour ChatGPT.

OpenAI, tout en niant avoir utilisé la voix de Johansson sans autorisation ou une imitation, a par la suite supprimé cette voix.