Anthropic 声称其最新模型为同类最佳

Anthropic 正在发布一款强大的新型生成式 AI 模型，名为 Claude 3.5 Sonnet，同时还发布了他们称之为 Artifacts 的功能。
Claude 3.5 Sonnet 可以分析文本和图像，同时还能生成文本，使其成为 Anthropic 迄今为止表现最佳的模型。

我们的观点
这些进步不仅彰显了技术实力，也展示了人工智能拓宽实际应用的潜力，在多样化的现实场景中提供更准确、更易用的解决方案。随着人工智能的不断发展，视觉解读方面的进步将为更具包容性和高效的数字互动铺平道路，有望为各行各业和用户体验带来巨大收益。
——Revel Cheng，BTW 记者

OpenAI 的竞争对手 Anthropic 正在发布一款强大的新型生成式 AI 模型，名为 Claude 3.5 Sonnet。

发生了什么

OpenAI 的竞争对手 Anthropic 正在发布一款强大的新型生成式 AI 模型，名为 Claude 3.5 Sonnet。但这更像是渐进式的进步，而非巨大的飞跃。

Claude 3.5 Sonnet 既能分析文本和图像，又能生成文本，从纸面上看，它是 Anthropic 目前表现最好的模型。在涉及阅读、编程、数学和视觉的多个 AI 基准测试中，Claude 3.5 Sonnet 的性能超越了它所取代的 Claude 3 Sonnet，并且击败了 Anthropic 之前的旗舰模型 Claude 3 Opus。

Claude 3.5 Sonnet 的性能比 Claude 3 Opus 稍好一些，Anthropic 表示，该模型能更好地理解细微复杂的指令以及幽默等概念。（不过，AI 是出了名的毫无幽默感。）但对于使用 Claude 构建需要即时响应的应用（例如客服聊天机器人）的开发者来说，或许更重要的是，Claude 3.5 Sonnet 的速度更快。Anthropic 声称，它的速度大约是 Claude 3 Opus 的两倍。

Anthropic 的产品负责人 Michael Gerstenhaber 表示，这些改进得益于架构调整和新的训练数据，包括 AI 生成的数据。具体是哪些数据？Gerstenhaber 不愿透露，但他暗示 Claude 3.5 Sonnet 的大部分能力都来自这些训练数据集。

为什么重要

基准测试不一定是最有用的 AI 进步衡量标准，部分原因在于许多测试针对的是普通人用不到的深奥边缘情况，比如回答健康考试题目。但不管怎样，在 Anthropic 对其测试的一些基准中，Claude 3.5 Sonnet 刚刚好超越了竞品领先模型，包括 OpenAI 最近推出的 GPT-4o。

根据 Anthropic 的说法，视觉——尤其是分析照片方面——是 Claude 3.5 Sonnet 相较于 Claude 3 Opus 有显著提升的一个领域。Claude 3.5 Sonnet 可以更准确地解读图表和图形，并从“不完美”的图像（例如带有失真和视觉伪影的图片）中转录文字。

伴随新模型，Anthropic 还发布了他们称之为 Artifacts 的工作区，用户可以在其中编辑和添加由 Anthropic 模型生成的内容，例如代码和文档。Anthropic 表示，Artifacts 目前处于预览阶段，不远的将来将增加新功能，例如与更大团队协作以及存储知识库的方法。

Anthropic 声称其最新模型为同类最佳

发生了什么

为什么重要

信号简报

运营足迹

市场背景

关注事项

深度趋势背景

战略圈

领导联盟

战略圈简报

领导联盟简报