- La plateforme de transcription d’AWS peut désormais reconnaître 100 langues parlées différentes après une mise à jour IA qui en a ajouté 21.
- La mise à jour comprend principalement des améliorations de précision, de lisibilité et l’introduction de nouvelles fonctionnalités d’IA.
- Cette mise à jour devrait renforcer la popularité et la compétitivité d’AWS, et offrir aux utilisateurs une expérience de transcription plus pratique.
Amazon Transcribe, la plateforme de transcription d’AWS, peut désormais reconnaître plus de 100 langues parlées.
Annoncée lors du récent événement AWS re:Invent, la mise à jour ajoute 21 nouvelles langues aux 79 déjà prises en charge, portant le total à 100. Les nouvelles langues incluent l’afrikaans, l’albanais, l’amharique, l’arménien, l’azéri, le bengali, le bosniaque, le bulgare, le birman, le croate, le dari, l’estonien, le géorgien, le haoussa, le kannada, le khmer, le kurde, le letton, le lituanien, le macédonien, le malayalam, le marathi, le mongol, le népalais, le pachto, le persan, le serbe, le cinghalais, le slovaque, le slovène et le tamoul.
Améliorations de la précision
Amazon Transcribe utilise des algorithmes auto-supervisés sophistiqués, entraînés sur de grandes quantités de données audio non étiquetées, pour appréhender les schémas vocaux universels de différentes langues et accents. Grâce à un échantillonnage intelligent des données, il garantit un haut niveau de précision, en particulier pour les langues sous-représentées.
Amazon Transcribe a considérablement amélioré sa précision grâce à son modèle vocal de base, affichant des améliorations de 20 à 50 % pour la plupart des langues. La reconnaissance vocale téléphonique enregistre des gains encore plus substantiels, allant de 30 à 70 %.
Le logiciel a des implications pour divers secteurs, notamment, par exemple, les unités d’intervention d’urgence.
Selon Alex Dizengof, cofondateur et directeur technique de Carbyne, une société de logiciels qui développe des solutions de centre de contact cloud critiques pour les intervenants d’urgence, « En tirant parti du nouveau modèle de fondation multilingue d’Amazon Transcribe pour la reconnaissance vocale, Carbyne sera encore mieux équipée pour démocratiser les services d’urgence vitaux, car chaque personne compte. »
À lire aussi: L’utilisation de l’IA par la Formule 1 pour faire respecter les limites de piste est-elle meilleure que celle des humains ?

Améliorations de la lisibilité
En plus du vaste répertoire de langues prises en charge, Amazon Transcribe a amélioré la lisibilité et l’expérience utilisateur. Ce modèle ASR (reconnaissance automatique de la parole) étendu peut offrir une expérience de reconnaissance vocale transparente pour les clients existants et nouveaux en mode batch, sans aucune modification des points de terminaison API ou des paramètres d’entrée.
Nouvelles fonctionnalités d’IA
Les nouvelles fonctionnalités d’IA incluent la ponctuation automatique, le vocabulaire personnalisé, la reconnaissance automatique de la langue et le filtrage du vocabulaire personnalisé, augmentant ainsi la flexibilité et la personnalisation du système.
De plus, la prise en charge étendue du système pour différents accents, environnements bruyants et conditions acoustiques permet de générer des sorties plus précises, permettant aux utilisateurs d’intégrer plus efficacement la technologie vocale dans leurs applications.
Dans l’ensemble, cette mise à jour offre aux utilisateurs une expérience plus facile et plus flexible, et la mise à jour d’Amazon Transcribe devrait la rendre très populaire et plus compétitive.
À lire aussi: La course aux revenus d’OpenAI est-elle une menace pour l’humanité ?

