- 该文本水印方法包括对 ChatGPT 选词方式进行微小调整,并在文本中创建不可见水印,以便后续通过独立工具检测。
- OpenAI 对文本水印的潜在负面影响持谨慎态度,包括被恶意行为者绕过的风险,以及可能对非英语使用者等群体造成不成比例的影响。
本刊观点
OpenAI 的文本水印方法通过重点检测 ChatGPT 生成的文本,在解决此问题中发挥着重要作用,提供了一种针对潜在欺诈内容的检测方法。然而,该方法也引发了对其被恶意行为者绕过以及对非英语使用者等特定群体潜在影响的重要关切。
-Lia XU,BTW 记者
事件经过
据《华尔街日报》报道,OpenAI 开发了一种文本水印方法,用于检测 AI 生成的文本,特别侧重于抓住那些使用 ChatGPT 写作业作弊的学生。该方法涉及对 ChatGPT 选词方式做出细微调整,在文本中创建不可见水印,后续可通过独立工具检测。
然而,OpenAI 的一位发言人表示:“我们正在采取‘审慎的态度’,因为涉及的复杂性及其对 OpenAI 以外更广泛生态系统的可能影响。因为我们在研究替代方案的同时,正在权衡重要风险,包括被恶意行为者绕过的可能性,以及可能对非英语使用者等群体造成不成比例的影响。”
OpenAI 还更新了其博客,指出虽然其文本水印可以很好地检测某些 AI 生成内容,但很容易被恶意行为者绕过,并且可能阻碍非英语母语者将 AI 作为有用的写作工具。
另请阅读:OpenAI 支持立法塑造 AI 未来
重要性
这种文本水印方法可以帮助教育机构通过识别学生使用 AI 在作业中作弊的情况来维护学术诚信。它可以阻止学术不端行为,促进公平的评估实践。专注于检测 ChatGPT 生成的文本,使该方法与其他方法区分开来,确保更准确地识别 AI 生成文本。这种有针对性的方法提高了该工具在抓住潜在作弊行为方面的有效性。
然而,在伦理部署方面,考虑被恶意行为者绕过的风险以及对特定用户群体(如非英语使用者)的潜在影响也至关重要。他们需要寻求平衡的实施方法。OpenAI 对文本水印方法相关风险的研究和权衡策略,表明了其对开发负责任的 AI 技术的承诺。这种影响力确保了该工具的部署符合伦理标准,并最大限度地减少对各种用户群体和生态系统的负面影响。

