• Microsoft 的 Azure 为 AI 模型引入新的安全功能,包括 Prompt Shields 和 Groundedness Detection,旨在检测漏洞并阻止恶意提示。
  • 这些功能增强了过滤不当内容的控制能力,以应对人们对 AI 模型安全性的担忧。
  • Microsoft 对 AI 安全的承诺与 Azure 不断扩展的 AI 能力及日益增长的需求相符。

Microsoft 负责 AI 的首席产品官Sarah Bird在接受 The Verge 采访时透露,她的团队为 Azure 客户设计了新的安全功能并已推出。这些功能由 LLM 技术驱动,旨在检测漏洞、监控看似合理但无依据的场景,并为使用AzureAI 模型的用户实时阻止恶意提示。

相关阅读:Windows 因 Microsoft AI 重组而迎来新管理层

相关阅读:Microsoft Teams 正在获得更智能的 Copilot AI 功能

多种功能提升安全性

这些功能包括 Prompt Shields、Groundedness Detection 以及安全性评估,未来还将推出如引导模型输出安全内容、追踪有问题的用户提示等功能。值得注意的是,该系统会在处理前评估输入提示中的禁用词和隐藏线索,确保响应与期望结果一致。

可过滤 AI 模型中的仇恨言论或暴力内容

Bird 强调,用户可自定义控制对 AI 模型中仇恨言论或暴力内容的过滤,以应对人们对不当内容的担忧。这些安全措施适用于像GPT-4Llama 2这样的流行模型,但使用较小、不太常用的开源模型的用户可能需要手动配置这些功能。

Microsoft 致力于提升 AI 安全,这与 Azure AI 能力日益增长的需求相契合,近期旨在扩展模型产品的合作伙伴关系也强调了这一点。