- OpenAI 的 Voice Engine 利用文本转语音API 和 ChatGPT语音技术,创造出富有情感且逼真的声音,并通过小规模预览分享了初步见解。
- OpenAI 的 Voice Engine 因其语言翻译能力而受到赞誉,但由于担心潜在滥用和合成语音的误用,其发布采取了谨慎态度。
- OpenAI 倡导负责任地部署合成语音,并以近期 Steve Kramer 克隆拜登总统声音的事件为例,此举旨在为决策提供更多信息。
OpenAI 发布了 Voice Engine,这是一款基于人工智能的音频克隆工具,尽管它具备阅读辅助和语音识别潜力。该公司对潜在滥用感到担忧,并致力于开发安全有益的人工智能。
卓越的技术能力
OpenAI 的 Voice Engine 利用其文本转语音 API 和 ChatGPT 语音技术来克隆声音,仅需 15 秒的样本即可生成富有情感且逼真的声音,这与需要陌生人语调和抑扬顿挫的传统朗读方式不同。
该公司已从其 Voice Engine 模型的小规模预览中发布了初步见解和结果,该模型利用文本输入和 15 秒音频样本生成自然语音。
Voice Engine 的训练数据尚不明确,这引发了人们对被指侵犯版权的 AI 公司的担忧。OpenAI 声称属于合理使用,但权利持有人正提起诉讼要求获得未付赔偿。
延伸阅读:Google.org 推出面向非营利组织的生成式人工智能加速器
延伸阅读:Jensen Huang 是谁?芯片制造商 Nvidia 的创始人,在成为 AI 领域领军人物之前曾是“麻烦制造者”
OpenAI 的双刃剑
OpenAI 的 Voice Engine 允许用户更改说话者的语言,因其令人印象深刻的音频片段和语言翻译能力而备受赞誉。然而,由于潜在的合成语音滥用风险,该公司对更广泛的发布持谨慎态度。OpenAI 在 2022 年底公开发布 ChatGPT 后,已成为一个庞大的实体,其发布可能会带来新的滥用行为。
OpenAI 旨在探讨合成语音的负责任部署以及社会如何适应这些新能力。近期,Steve Kramer 克隆了总统 Joe Biden 的声音,制作了一条自动语音电话,敦促人们不要在新罕布什尔州初选中投票。OpenAI 计划根据对话和小规模测试做出明智决策,以更全面地了解该技术的潜力。
最新的加密货币骗局利用在 Fiverr 上雇佣的真实演员来朗读脚本,使骗局看起来真实可信。这突显了在骗局中使用虚假 AI 生成声音的潜在危险,因为诈骗分子总会利用新兴工具骗取人们的钱财。

