- 语音引擎(Voice Engine)是 OpenAI 开发的一款文本转语音生成平台,目前正提供创建合成语音的访问权限。
- AI 语音技术的不道德使用可能导致垃圾信息并引发担忧。
语音克隆模型“语音引擎”自 2022 年末开始开发,它可以根据某人 15 秒的声音片段生成合成语音。然而,随着生成式 AI 的不断发展,伦理问题也随之而来。
OpenAI 推出语音引擎
OpenAI 发布了语音引擎,这是一个文本转语音生成平台,能够根据短语音片段创建合成语音。
另请阅读:OpenAI 语音克隆工具:仅需 15 秒样本即可模仿您的声音
这项创新技术可以产生 AI 生成的语音,用多种语言朗读文本提示,具有在多个行业的潜在应用。
语音引擎的有限访问权限已授予部分公司,包括 Age of Learning、HeyGen、Dimagi、Livox 和 Lifespan。
OpenAI 在伦理方面的考量
上个月,在人们接到使用 AI 克隆的总统乔·拜登声音的骚扰电话后,联邦通信委员会禁止了自动语音电话。
为了应对这些担忧,OpenAI 引入了围绕 AI 语音技术的伦理准则。合作伙伴必须遵守使用政策,禁止未经同意的冒充行为,要求获得明确的说话人同意,并向听众披露 AI 生成的声音。
OpenAI 还实施了水印技术以追踪音频来源,并积极监控其使用情况。该倡议是减轻 AI 相关风险的更广泛努力的一部分,包括逐步淘汰基于语音的身份验证、实施保护个人声音的政策、加强关于 AI 深度伪装的教育,以及开发 AI 内容追踪系统。

