2024 年 4 月 1 日,美国与英国签署了一份谅解备忘录,通过各自的国家 AI 安全研究所协调 AI 安全测试。该协议将此前 AI 安全峰会的承诺转化为模型评估、研究对齐、信息共享以及可能的人员交流的工作渠道。

其公共意义在于,先进模型测试正成为国家间技术合作的正式领域。两所机构打算开发共享的模型评估方法,至少对一款公开可访问的模型进行一次联合测试,并与其他政府就 AI 安全测试标准建立联系。