Anthropic 计划资助新 AI 基准测试开发，关注安全与社会影响，提升 AI 行业标准

周一揭晓，Anthropic 启动了一项新计划，旨在资助开发能够评估 AI 模型性能和影响的新基准测试。
Anthropic 希望创建的新基准测试更侧重于人工智能的安全性和社会影响，但考虑到该公司在 AI 竞争中的商业野心，其行为可能另有目的。

我们的观点
Anthropic 推出 AI 基准测试开发计划，资助第三方组织以评估模型性能和影响，旨在提高 AI 安全性。然而，其商业野心值得怀疑，且对 AI 风险认知存在不同观点。尽管这些努力值得称赞，但该基准测试的普遍意义仍有待观察，其价值需要持续评估。
–Jasmine Zhang，BTW 记者

发生了什么

Anthropic宣布启动一项计划，旨在资助开发新的基准测试，以评估 AI 模型的性能和影响。该计划于周一公布，将为能够有效衡量 AI 模型先进能力的第三方组织提供资金支持。

Anthropic 在其官方博客中表示，这项投资旨在提升整个 AI 安全领域，并提供有利于整个生态系统的宝贵工具。开发高质量、与安全相关的评估仍然具有挑战性，需求远大于供给。当前的 AI 基准测试存在缺陷，难以反映普通人实际使用系统的情况，而且一些旧的基准测试是否真正衡量了其所声称的内容也值得怀疑。

Anthropic 提出的解决方案是通过新工具、基础设施和方法，创建侧重于 AI 安全和社会影响的挑战性基准测试。该公司特别呼吁开发和评估模型，以测试网络攻击能力、增强大规模杀伤性武器以及操纵或欺骗人类的能力。对于与国家安全和国防相关的 AI 风险，Anthropic 承诺开发“预警系统”，但未在博客中披露具体细节。

另请阅读：施耐德与 NVIDIA 打造 AI“基准”数据中心设计

另请阅读：Anthropic 声称其最新模型是同类最佳

为什么重要

当前，人工智能的研究、开发和监管都处于快速发展阶段。Anthropic 为支持新的人工智能基准测试所做的努力具有开创性，并且在某种程度上是免费且没有回报的，这当然值得称赞。

然而，需要注意的是，考虑到该公司在人工智能竞争中的商业野心，我们需要对 Anthropic 提供的新基准测试保持怀疑态度。

人工智能界的一些人也对 Anthropic 提到的人工智能“灾难性”和“欺骗性”风险持反对意见。许多专家认为，几乎没有证据表明人工智能在短期内会获得终结世界和超越人类的能力。因此，关于 Anthropic 在创建新的 AI 基准测试方面所做的努力是否具有普遍意义，其行为是否有自私的利益获取动机，以及新基准测试的检测结果是否具有参考价值，仍有进一步讨论的空间。

Anthropic 计划资助新 AI 基准测试

发生了什么

为什么重要

运营领域

时间线

概要

功能说明

重要性

关注事项

深度档案背景

战略圈

领导联盟

战略圈简报

领导联盟简报

公开视角

观察点

限制说明

常见问题

为什么收录 Anthropic 计划资助新 AI 基准测试？

这个档案的公开部分是什么？

读者接下来应关注什么？