- OpenAI 的 ChatGPT 语音助手正在向付费用户推出,提供口语式回复,并新增五种语音选项。
- 该功能此前因安全顾虑而推迟,现已上线,但尚缺部分最初承诺的功能,如基于视觉的反馈。
我们的观点
OpenAI 已向所有付费 ChatGPT 用户推出新语音助手功能,以今年早些时候首次预告的高级语音模式为基础。该语音助手现面向 ChatGPT Plus 和 ChatGPT Team 订阅用户开放。它使 AI 更具交互性,但未包含所有原始功能,例如计算机视觉反馈。新增五种语音选项,OpenAI 已确保该工具不会模仿真实人声。
–Heidi Luo,BTW 记者
发生了什么
OpenAI 已向所有 ChatGPT 付费用户推出其新语音助手功能,标志着其 AI 能力的大幅扩展。该语音助手最初于 2024 年 5 月公布,允许用户以口语提示和回复与 AI 交互。
最初因安全顾虑而被推迟,该功能现已面向 ChatGPT Plus 和 Team 服务订阅用户开放,预计下周将向 Enterprise 和 Edu 用户开放更广泛的访问。
新的语音模式提供九种语音,包括最近添加的选项如“arbor”和“maple”,但某些预期功能,如基于视觉输入提供语音反馈,仍缺失。OpenAI 已实施安全过滤器,以防止语音助手被滥用,生成受版权保护或模仿他人声音的音频。
另请阅读:梅赛德斯-奔驰推出 AI 增强型 MBUX 虚拟助手,提供个性化驾驶体验
为何重要
OpenAI 的 ChatGPT 语音助手的扩展反映出业界正日益追求更类人化的 AI 交互,使 AI 助手更易于使用且功能更丰富。
通过引入语音命令,OpenAI 正将自己定位为与其他 AI 助手(如苹果 Siri或亚马逊 Alexa)更直接竞争。
安全措施将确保该工具避免道德陷阱,例如创建未经授权的语音模仿。这一发展突显了 OpenAI 谨慎而渐进的 AI 方法,在创新与防止滥用的责任之间取得平衡。
新推出的语音助手未能提供某些此前承诺的功能,例如通过智能手机摄像头分析用户动作并提供语音反馈的能力。
尽管如此,OpenAI 通过额外增加五种语音扩展了产品线,使其总数达到九种。这些新语音拥有独特的、受自然启发的名字,如 Arbor、Spruce 和 Maple。

