- 周一揭晓,Anthropic 启动了一项新计划,旨在资助开发能够评估 AI 模型性能和影响的新基准测试。
- Anthropic 希望创建的新基准测试更侧重于人工智能的安全性和社会影响,但考虑到该公司在 AI 竞争中的商业野心,其行为可能另有目的。
我们的观点
Anthropic 推出 AI 基准测试开发计划,资助第三方组织以评估模型性能和影响,旨在提高 AI 安全性。然而,其商业野心值得怀疑,且对 AI 风险认知存在不同观点。尽管这些努力值得称赞,但该基准测试的普遍意义仍有待观察,其价值需要持续评估。
–Jasmine Zhang,BTW 记者
发生了什么
Anthropic宣布启动一项计划,旨在资助开发新的基准测试,以评估 AI 模型的性能和影响。该计划于周一公布,将为能够有效衡量 AI 模型先进能力的第三方组织提供资金支持。
Anthropic 在其官方博客中表示,这项投资旨在提升整个 AI 安全领域,并提供有利于整个生态系统的宝贵工具。开发高质量、与安全相关的评估仍然具有挑战性,需求远大于供给。当前的 AI 基准测试存在缺陷,难以反映普通人实际使用系统的情况,而且一些旧的基准测试是否真正衡量了其所声称的内容也值得怀疑。
Anthropic 提出的解决方案是通过新工具、基础设施和方法,创建侧重于 AI 安全和社会影响的挑战性基准测试。该公司特别呼吁开发和评估模型,以测试网络攻击能力、增强大规模杀伤性武器以及操纵或欺骗人类的能力。对于与国家安全和国防相关的 AI 风险,Anthropic 承诺开发“预警系统”,但未在博客中披露具体细节。
另请阅读:施耐德与 NVIDIA 打造 AI“基准”数据中心设计
为什么重要
当前,人工智能的研究、开发和监管都处于快速发展阶段。Anthropic 为支持新的人工智能基准测试所做的努力具有开创性,并且在某种程度上是免费且没有回报的,这当然值得称赞。
然而,需要注意的是,考虑到该公司在人工智能竞争中的商业野心,我们需要对 Anthropic 提供的新基准测试保持怀疑态度。
人工智能界的一些人也对 Anthropic 提到的人工智能“灾难性”和“欺骗性”风险持反对意见。许多专家认为,几乎没有证据表明人工智能在短期内会获得终结世界和超越人类的能力。因此,关于 Anthropic 在创建新的 AI 基准测试方面所做的努力是否具有普遍意义,其行为是否有自私的利益获取动机,以及新基准测试的检测结果是否具有参考价值,仍有进一步讨论的空间。

