- OpenAI retrasó el nuevo Modo de Voz de ChatGPT, lo que obligó a posponer el lanzamiento para algún momento de julio.
- El retraso no afectará la implementación de las nuevas capacidades de video y uso compartido de pantalla mostradas por separado durante el evento de prensa de primavera de OpenAI.
NUESTRA OPINIÓN
Esta decisión demuestra el fuerte enfoque de la empresa en garantizar la calidad del producto y la experiencia del usuario, al tiempo que pone de relieve los desafíos y complejidades que surgen al introducir nuevas tecnologías. A medida que la tecnología de IA continúa evolucionando, las decisiones y estrategias de OpenAI tienen un profundo impacto tanto en la industria como en los usuarios, especialmente en lo que respecta al avance de la tecnología de voz y a garantizar la seguridad de los datos.
–Revel Cheng, reportero de BTW
OpenAI retrasó el nuevo Modo de Voz de ChatGPT, lo que obligó a posponer el lanzamiento para algún momento de julio.
Qué sucedió
En una publicación en el servidor oficial de Discord deOpenAI, OpenAI dice que había planeado comenzar a implementar el modo de voz avanzado en alfa para un pequeño grupo de usuarios deChatGPT Plusa finales de junio, pero que problemas persistentes obligaron a posponer el lanzamiento hasta algún momento de julio.
En mayo, cuando OpenAI mostró por primera vez un inquietantemente realista y casi en tiempo real “modo de voz avanzado” para su plataforma de chatbot impulsada por IA ChatGPT, la empresa dijo que la función se implementaría para los usuarios de pago de ChatGPT en unas pocas semanas.
Meses después, OpenAI dice que necesita más tiempo.
OpenAI dice que el Modo de Voz Avanzado podría no lanzarse para todos los clientes de ChatGPT Plus hasta el otoño, dependiendo de si pasa ciertas verificaciones internas de seguridad y confiabilidad. Sin embargo, el retraso no afectará la implementación de las nuevas capacidades de video y uso compartido de pantalla mostradas por separado durante el evento de prensa de primavera de OpenAI.
Esas capacidades incluyen resolver problemas matemáticos a partir de una imagen del problema y explicar varios menús de configuración en un dispositivo. Están diseñadas para funcionar en ChatGPT tanto en teléfonos inteligentes como en clientes de escritorio, como la aplicación para macOS, que está disponible para todos los usuarios de ChatGPT.
También lea:¿Es Gemini AI de código abierto? Esto es lo que necesita saber
También lea:Google presenta Gemma, un modelo de IA abierto y ligero
Por qué es importante
En el escenario del evento de lanzamiento, los empleados de OpenAI mostraron a ChatGPT respondiendo casi al instante a solicitudes como resolver un problema matemático en un papel colocado frente a la cámara del teléfono inteligente de un investigador.
“El modo de voz avanzado de ChatGPT puede comprender y responder con emociones y señales no verbales, acercándonos a conversaciones naturales en tiempo real con la IA”, escribe OpenAI. “Nuestra misión es brindarles estas nuevas experiencias de manera reflexiva”.
El modo de voz avanzado de OpenAI generó bastante controversia por la similitud de la voz predeterminada “Sky” con la de la actriz Scarlett Johansson. Johansson publicó más tarde un comunicado diciendo que contrató asesoría legal para investigar la voz y obtener detalles exactos sobre cómo se desarrolló, y que había rechazado repetidas solicitudes de OpenAI para licenciar su voz para ChatGPT.
OpenAI, aunque negó haber usado la voz de Johansson sin permiso o una imitación, posteriormente eliminó la voz ofensiva.

