- Voice Engine de OpenAI utiliza la API de texto a vozy la tecnología Voice de ChatGPTpara crear voces emotivas y realistas, con información preliminar compartida desde una vista previa a pequeña escala.
- Voice Engine de OpenAI, elogiado por sus capacidades de traducción de idiomas, se lanza con precaución debido a la preocupación por posibles abusos y el uso indebido de voces sintéticas.
- OpenAI aboga por un despliegue responsable de voces sintéticas, citando el reciente incidente de Steve Kramer, quien clonó la voz del presidente Biden para la toma de decisiones informadas.
OpenAI ha presentado Voice Engine, una herramienta de clonación de audio basada en IA, a pesar de su potencial para la asistencia de lectura y el reconocimiento de voz. La compañía está preocupada por el posible abuso y se compromete a desarrollar una IA segura y beneficiosa.
Excelentes capacidades tecnológicas
Voice Engine de OpenAI utiliza su API de texto a voz y la tecnología Voice de ChatGPT para clonar una voz, usando una muestra de 15 segundos para crear voces emotivas y realistas, a diferencia de los métodos de lectura tradicionales que requieren el tono y la inflexión de un extraño.
La compañía ha publicado información y resultados preliminares de una vista previa a pequeña escala de su modelo Voice Engine, que utiliza entrada de texto y una muestra de audio de 15 segundos para generar un habla que suena natural.
Los datos de entrenamiento de Voice Engine no están claros, lo que genera preocupación para las empresas de IA acusadas de violaciones de derechos de autor. OpenAI afirma el uso legítimo, pero los titulares de derechos están demandando por compensación no pagada.
Lea también:Google.org lanza acelerador de IA generativa para organizaciones sin fines de lucro
La espada de doble filo de OpenAI
Voice Engine de OpenAI, que permite a los usuarios cambiar el idioma de un hablante, ha sido elogiado por sus impresionantes clips de audio y sus capacidades de traducción de idiomas. Sin embargo, la compañía está adoptando un enfoque cauteloso para un lanzamiento más amplio debido al potencial de uso indebido de voces sintéticas. OpenAI, que lanzó ChatGPT públicamente a finales de 2022, se ha convertido en una entidad masiva, y su lanzamiento podría exponer potencialmente nuevos abusos.
OpenAI tiene como objetivo debatir el despliegue responsable de las voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades. En un incidente reciente, Steve Kramer clonó la voz del presidente Joe Biden para crear un mensaje de llamada automática instando a la gente a no votar en las primarias de New Hampshire. OpenAI planea tomar decisiones informadas basadas en conversaciones y pruebas a pequeña escala, con el objetivo de crear una comprensión más informada del potencial de la tecnología.
La última estafa de criptomonedas utiliza actores reales contratados en Fiverr para leer un guion, presentando la estafa como auténtica. Esto pone de relieve los peligros potenciales del uso de voces falsas generadas por IA en las estafas, ya que los estafadores siempre explotarán las herramientas emergentes para engañar a la gente y quitarles su dinero.

