• Super、Nano 和 Edge 专注于精度、速度和边缘推理

• Cosmos 3 在开放模型基准测试中领先;联盟成员涵盖机器人、视频生成和自动驾驶汽车


事实

NVIDIA 已推出 Cosmos 3,这是一个基于混合 Transformer 架构的开放物理 AI 基础模型。它原生支持文本、图像、视频、环境声音以及动作的理解和生成。Cosmos 3 基于数十亿个多模态物理 AI 样本训练,可将训练和评估周期从数月缩短至数天。在多个物理 AI 基准测试中,Cosmos 3 在世界生成、动作策略和视觉理解方面均位居开放模型榜首。该产品线包括 Super、Nano 和即将推出的 Edge 版本,而 Cosmos 联盟则包括 Agile Robots、Runway 和 Skild AI。

评估

Cosmos 3 将 NVIDIA 从硬件领域延伸到物理 AI 开发的软件层。通过将合成数据生成、世界建模和动作策略训练整合到一个开放模型家族中,NVIDIA 降低了机器人、自动驾驶汽车和视觉智能体的入门成本。其战略意义不仅在于模型性能,更在于 NVIDIA 试图让其软件栈成为从仿真到现实部署的默认路径——这不禁让人联想到 CUDA 在 GPU 计算中的主导地位。对 BTW 读者而言,Edge 版本的实时推理需求将检验 NVIDIA 的嵌入式芯片(Jetson)能否跟上对延迟敏感的机器人工作负载。

关注点

关注 Cosmos Edge 在实际部署中的延迟和功耗、联盟开发的应用,以及该模型系列是否会推动 Jetson 和 DGX 的需求。