- Google ha presentado tres nuevos modelos Gemma 2, incluido el ligero Gemma 2 2B, que supera a modelos más grandes con un menor recuento de parámetros.
- Además, ShieldGemma actúa como un clasificador de seguridad, y Gemma Scope ofrece una interpretabilidad mejorada. Estos modelos están diseñados para fomentar una inteligencia artificial más segura, eficiente y transparente.
NUESTRA OPINIÓN
Los nuevos modelos Gemma 2 de Google ejemplifican un cambio hacia una IA más eficiente, segura y transparente. Al demostrar que los modelos más pequeños pueden superar a los más grandes, Google desafía el statu quo y promueve el desarrollo responsable de la IA. El enfoque en la seguridad y la interpretabilidad es encomiable, fomentando la confianza y una adopción más amplia.
–Vicky Wu, reportera de BTW
Lo sucedido
Googleha lanzado tres nuevos modelos de su familia Gemma 2 de IA generativa, promocionados como más pequeños, seguros y transparentes que sus pares. Los nuevos modelos, Gemma 2 2B, ShieldGemma y Gemma Scope, están diseñados para adaptarse a diversas aplicaciones, priorizando la seguridad y la interpretabilidad.
Gemma 2 2B es unmodelo de lenguaje de gran tamaño(LLM, por sus siglas en inglés) ligero optimizado para su funcionamiento en dispositivos locales y con licencia para investigación y uso comercial. A pesar de tener solo 2.600 millones de parámetros, Gemma 2 2B supera a modelos más grandes como GPT-3.5 de OpenAI y Mistral 8x7B de Mistral AI, según evaluaciones independientes. En cambio, Gemma 2 2B demuestra la eficacia de técnicas avanzadas de entrenamiento, arquitecturas superiores y datos de alta calidad. Google espera que esto impulse un cambio hacia el perfeccionamiento de los modelos en lugar de aumentar su tamaño, y destaca la importancia de la compresión y destilación de modelos para una IA más accesible con menores demandas computacionales.
ShieldGemma es una colección de clasificadores de seguridad que detectan contenido tóxico, como discurso de odio y material sexualmente explícito, filtrando indicaciones y contenido generado. Gemma Scope proporciona una mayor transparencia al permitir a los desarrolladores examinar aspectos específicos de los modelos Gemma 2, haciendo que su funcionamiento interno sea más interpretable.
Lea también:Apple utiliza chips de Google para el entrenamiento de modelos de IA
Lea también:Organismo antimonopolio del Reino Unido examina la alianza de Google con Anthropic
Por qué es importante
Estos lanzamientos se producen poco después de que el Departamento de Comercio de EE. UU. respaldara los modelos de IA abiertos, destacando los beneficios de ampliar la accesibilidad de la IA generativa. Los nuevos modelos demuestran que tamaños de parámetros más pequeños pueden lograr un rendimiento competitivo gracias a técnicas avanzadas de entrenamiento y datos de alta calidad, desafiando la noción de que los modelos más grandes siempre funcionan mejor.
Los modelos Gemma 2 de Google fomentan la buena voluntad dentro de la comunidad de IA, de forma similar a los modelos Llama de Meta, al ofrecer opciones completamente de código abierto. El énfasis en la seguridad y la interpretabilidad es crucial a medida que las organizaciones adoptan cada vez más tecnologías de IA, garantizando un despliegue responsable y ético.
La disponibilidad de estos modelos marca un paso significativo hacia una IA más accesible y responsable, lo que podría conducir a un cambio en el enfoque de la industria del tamaño bruto al refinamiento y la optimización.

