- La plataforma de transcripción de AWS ahora puede reconocer 100 idiomas diferentes después de que una actualización de IA añadiera 21.
- La actualización incluye principalmente mejoras de precisión, mejoras de legibilidad y la introducción de nuevas funciones de IA.
- Se espera que esta actualización impulse la popularidad y competitividad de AWS, y ofrezca a los usuarios una experiencia de transcripción más cómoda.
Amazon Transcribe, la plataforma de transcripción de AWS, ahora puede reconocer más de 100 idiomas hablados.
Anunciada en el reciente evento AWS re:Invent, la actualización añade 21 nuevos idiomas a los 79 existentes, elevando el total a 100. Los nuevos idiomas incluyen afrikáans, albanés, amárico, armenio, azerbaiyano, bengalí, bosnio, búlgaro, birmano, croata, darí, estonio, georgiano, hausa, canarés, camboyano, kurdo, letón, lituano, macedonio, malayalam, maratí, mongol, nepalí, pastún, persa, serbio, cingalés, eslovaco, esloveno y tamil.
Mejoras de precisión
Amazon Transcribe utiliza sofisticados algoritmos autosupervisados entrenados con grandes cantidades de datos de audio no etiquetados para comprender patrones universales del habla en diversos idiomas y acentos. Mediante un muestreo inteligente de datos, garantiza un alto nivel de precisión, especialmente en idiomas con poca representación.
Amazon Transcribe ha mejorado significativamente la precisión gracias a su modelo base de habla, con mejoras del 20-50 % para la mayoría de los idiomas. El reconocimiento de voz telefónica experimenta avances aún mayores, que oscilan entre el 30 % y el 70 %.
El software tiene implicaciones para diversas industrias, incluidas, por ejemplo, las unidades de respuesta a emergencias.
Según Alex Dizengof, cofundador y director de tecnología de Carbyne, una empresa de software que desarrolla soluciones de centros de contacto críticas para la misión basadas en la nube para operadores de llamadas de emergencia: «Al aprovechar el nuevo sistema ASR multilingüe de Amazon Transcribe basado en modelos fundacionales, Carbyne estará aún mejor preparada para democratizar los servicios de emergencia vitales, porque Cada. Persona. Cuenta».
Lea también: ¿Es mejor el uso de la IA por parte de la Fórmula 1 para el control de límites de pista que el de los humanos?

Mejoras de legibilidad
Además del amplio directorio de idiomas compatibles, Amazon Transcribe ha mejorado la legibilidad y la experiencia del usuario. Este amplio modelo ASR (Reconocimiento automático de voz) puede ofrecer una experiencia de reconocimiento de voz fluida tanto para clientes nuevos como existentes en modo por lotes, sin necesidad de modificar los puntos finales de la API ni los parámetros de entrada.
Nuevas funciones de IA
Las nuevas funciones de IA incluyen puntuación automática, vocabulario personalizado, reconocimiento automático de idiomas y filtrado de vocabulario personalizado, lo que aumenta la flexibilidad y personalización del sistema.
Además, la compatibilidad ampliada del sistema con diferentes acentos, entornos ruidosos y condiciones acústicas ayuda a generar resultados más precisos, lo que permite a los usuarios integrar la tecnología de voz de manera más eficaz en las aplicaciones.
En general, esta actualización proporciona a los usuarios una experiencia más fácil y flexible, y se espera que la actualización de Amazon Transcribe la haga muy popular y más competitiva.
Lea también: ¿Es la carrera de OpenAI por los ingresos una amenaza para la humanidad?

