- OpenAI 推迟了 ChatGPT 的新语音模式,迫使公司将发布推迟到七月某个时候。
- 这次推迟不会影响在 OpenAI 春季新闻发布会上单独演示的新视频和屏幕共享功能的推出。
我们的观点
这一决定体现了该公司对确保产品质量和用户体验的强烈关注,同时也凸显了在引入新技术时面临的挑战和复杂性。随着 AI 技术的不断发展,OpenAI 的决策和策略对行业和用户都产生深远影响,尤其是在推进语音技术和确保数据安全方面。
–Revel Cheng,BTW 记者
OpenAI 推迟了 ChatGPT 的新语音模式,迫使公司将发布推迟到七月某个时候。
发生了什么
在OpenAI的官方 Discord 服务器上发布的一篇帖子中,OpenAI 表示,它原计划在 6 月底以 alpha 版本向一小部分ChatGPT Plus用户推出高级语音模式,但遗留问题迫使它将发布推迟到七月某个时候。
在五月,当 OpenAI 首次为其人工智能聊天机器人平台 ChatGPT 演示了一种极其逼真、近乎实时的“高级语音模式”时,该公司表示该功能将在几周内向付费 ChatGPT 用户推出。
几个月过后,OpenAI 表示需要更多时间。
OpenAI 表示,高级语音模式可能要到秋季才会向所有 ChatGPT Plus 客户推出,这取决于它是否通过某些内部安全和可靠性检查。然而,这次推迟不会影响在 OpenAI 春季新闻发布会上单独演示的新视频和屏幕共享功能的推出。
这些功能包括根据问题图片解决数学问题,以及解释设备上的各种设置菜单。它们旨在跨智能手机和桌面客户端上的 ChatGPT 工作,例如适用于 macOS 的应用程序,该应用程序对所有 ChatGPT 用户可用。
另请阅读:Google 推出 Gemma,一个轻量级开放 AI 模型
为什么重要
在发布活动的舞台上,OpenAI 员工展示了 ChatGPT 几乎立即响应请求,例如解决放在研究人员智能手机摄像头前的一张纸上的数学问题。
“ChatGPT 的高级语音模式能够理解并以情感和非语言线索做出回应,使我们更接近与 AI 进行实时、自然对话,”OpenAI 写道。“我们的使命是周到地将这些新体验带给你。”
OpenAI 的高级语音模式因其默认的“Sky”语音与演员 Scarlett Johansson 的声音相似而引发了不小的争议。Johansson 后来发表声明称,她聘请了法律顾问来调查该语音并了解其开发的具体细节——并且她拒绝了 OpenAI 多次关于将其声音授权给 ChatGPT 的恳求。
OpenAI 否认未经许可使用了 Johansson 的声音或相似声音,但后来还是删除了那个令人反感的语音。

