• Super, Nano y Edge apuntan a precisión, velocidad e inferencia en el borde

• Cosmos 3 lidera los benchmarks de modelos abiertos; los miembros de la coalición abarcan robótica, generación de video y vehículos autónomos


El hecho

NVIDIA ha lanzado Cosmos 3, un modelo base de IA física abierto construido sobre una arquitectura de mezcla de transformadores. Admite de forma nativa la comprensión y generación de texto, imagen, video, sonido ambiental y acciones. Entrenado con miles de millones de muestras multimodales de IA física, Cosmos 3 puede reducir los ciclos de entrenamiento y evaluación de meses a días. Cosmos 3 ocupa el primer lugar entre los modelos abiertos en múltiples benchmarks de IA física para generación de mundos, políticas de acción y comprensión visual.

La línea incluye Super, Nano y la próxima versión Edge, mientras que la Coalición Cosmos incluye a Agile Robots, Runway y Skild AI.

La evaluación

Cosmos 3 extiende a NVIDIA más allá del hardware hacia la capa de software del desarrollo de IA física. Al combinar generación de datos sintéticos, modelado de mundos y entrenamiento de políticas de acción en una familia de modelos abiertos, NVIDIA reduce los costos de entrada para robótica, vehículos autónomos y agentes de visión. La señal estratégica no es solo el rendimiento del modelo, sino el intento de NVIDIA de hacer que su stack sea la ruta predeterminada desde la simulación hasta el despliegue en el mundo real, un libro de jugadas que hace eco del dominio de CUDA en la computación de GPU.

Para los lectores de BTW, las demandas de inferencia en tiempo real de la variante Edge pondrán a prueba si el silicio embebido de NVIDIA (Jetson) puede seguir el ritmo de las cargas de trabajo robóticas sensibles a la latencia.

Qué observar

Observe la latencia y el consumo de energía de Cosmos Edge en despliegues reales, las aplicaciones construidas por la coalición y si la familia de modelos impulsa la demanda de Jetson y DGX.