NUESTRA OPINIÓN
El Zamba2-2.7B de Zyphra cambia las reglas del juego en IA, aumentando la velocidad y la eficiencia al tiempo que reduce el uso de memoria. Es como los coches eléctricos de Tesla: más potencia, menos recursos. Sus técnicas innovadoras lo convierten en un ninja entre los modelos de lenguaje, perfecto para entornos con limitaciones. Con su latencia reducida, es ideal para la computación en el borde. Y su lanzamiento como código abierto invita a la creatividad de los desarrolladores de todo el mundo.
–Miurio huang, reportero de BTW

¿Qué ocurrió

Zyphra, una empresa de IA con sede en Palo Alto especializada en computación probabilística, ha lanzado su última innovación, Zamba2-2.7B. Este nuevo modelo de lenguaje pequeño (SLM) promete avances significativos tanto en velocidad como en eficiencia, ofreciendo el doble de velocidad de rendimiento y reduciendo el uso de memoria en un 27% en comparación con modelos anteriores. Entrenado con un extenso conjunto de datos de unos 3 billones de tokens procedentes de fuentes propias de Zyphra, Zamba2-2.7B iguala las capacidades de modelos más grandes como Zamba1-7B y otros modelos de 7B, ofreciendo un alto rendimiento en un formato compacto.

El Zamba2-2.7B de Zyphra está diseñado para ser una solución atractiva para empresas, investigadores y desarrolladores gracias a sus capacidades avanzadas combinadas con una menor demanda computacional. El modelo utiliza técnicas innovadoras como el esquema de atención compartida intercalada con proyectores LoRA en bloques MLP compartidos, lo que mejora su capacidad para gestionar tareas complejas de manera eficiente.

También presume de una latencia de generación 1,29 veces menor en comparación con Phi3 de Microsoft, lo que lo convierte en una opción viable para dispositivos con memoria limitada y aplicaciones que requieren una comunicación fluida y continua.

Lea también: El sistema de IA de Microsoft ‘SpreadsheetLLM’ eleva la productividad empresarial

Lea también: DeepL lanza un nuevo LLM para usuarios empresariales

Por qué es importante

Zamba2-2.7B representa un salto adelante en la tecnología de modelos de lenguaje pequeños al ofrecer un alto rendimiento con un menor consumo de recursos. Su eficiencia lo hace ideal para su implementación en entornos con potencia computacional y memoria limitadas, mientras que sus características avanzadas garantizan una alta precisión y relevancia para tareas específicas. El lanzamiento del modelo como código abierto en Hugging Face, junto con una implementación pura en PyTorch, permite a investigadores y desarrolladores integrar y aprovechar sus capacidades ampliamente.

El lanzamiento de Zamba2-2.7B se basa en el éxito previo de Zyphra con su modelo Zamba de código abierto, que demostró un rendimiento superior frente a competidores como LLaMA 1 y 2, y OLMo-7B. Al ofrecer una alternativa rentable y de alto rendimiento, Zyphra está ampliando los límites de lo que pueden lograr los modelos de lenguaje pequeños, facilitando una adopción e innovación más amplias en diversas industrias.

Los avances en Zamba2-2.7B subrayan una tendencia creciente hacia la optimización de los modelos de IA en términos de eficiencia sin comprometer la capacidad, abordando tanto el rendimiento como las preocupaciones medioambientales en el despliegue de la IA.