• Meta 推出的全新 AI 模型 SAM 2 能够实时识别和跟踪视频中任何移动的物体,扩展了前代模型的图像处理能力,并为视频编辑和分析开辟了新机遇。
  • SAM 2 的实时分割技术展示了 AI 处理动态图像的能力,即使在物体移出画面再重新进入的情况下,也能准确区分屏幕上的元素。

我们的观点
Meta 推出了一款名为 Segment Anything Model 2(SAM 2)的新 AI 模型,能够实时识别和跟踪视频中的任何物体,为视频编辑和分析开辟了新可能。SAM 2 的实时分割技术表明 AI 能够处理运动图像,即使物体移出画面再重新进入,也能准确区分屏幕上的元素。

- Rae Li,BTW 记者

发生了什么

Meta 推出了一款先进的 AI 模型 SAM 2,能够实时识别和跟踪视频中的任何物体。与之前仅限于处理静态图像的 SAM 模型不同,SAM 2 扩展了其功能,可以处理视频内容。SAM 2 的实时分割技术展示了 AI 在处理动态图像方面的巨大进步,即使在物体移动、消失然后重新出现在视频中时,也能区分屏幕上的元素。这项技术具有广泛的应用前景,可受益于视频编辑到计算机视觉系统的开发,例如自动驾驶汽车中的视觉数据处理。

Meta 共享了一个包含 50,000 个视频的数据库,用于训练 SAM 2 模型。尽管 SAM 2 目前是开放且免费的,但这种状态可能无法长期持续。Meta 相信 SAM 2 有潜力革新交互式视频编辑和计算机视觉系统的开发,特别是在精确高效地跟踪物体方面。此外,SAM 2 的实时视频分割能力为 AI 在视频创作中的应用提供了新的视角,其影响比生成视频内容的 AI 模型更为广泛。

另请阅读:Meta 在德克萨斯州隐私标志性案件中支付 14 亿美元

另请阅读:Meta 发布 AI Studio 以增强社交互动

为何重要

Meta 推出 SAM 2 对视频编辑和分析领域意义重大,因为它标志着实时视频对象识别和跟踪技术的重大进步。SAM 2 的实时分割能力不仅提高了视频编辑的效率和准确性,也为计算机视觉系统在自动驾驶等应用中的使用开辟了新的可能性。通过能够准确识别和跟踪视频中的物体,SAM 2 为处理复杂的视觉数据提供了强大的工具。

SAM 2 的推出反映了 AI 技术在视频内容创建和处理方面的潜力。这种技术进步将推动视频内容创作的创新,并有可能改变我们与视频内容的互动方式,为用户带来更丰富、更个性化的视频体验。