• Los modelos fundacionales (FM) son grandes redes neuronales de aprendizaje profundo entrenadas con enormes conjuntos de datos que han cambiado la forma en que los científicos de la computación abordan el aprendizaje automático (ML).
  • En lugar de desarrollar inteligencia artificial desde cero, los científicos de datos utilizan el modelo subyacente como punto de partida para desarrollar modelos de aprendizaje automático.

Los modelos fundacionales son modelos de IA entrenados con grandes conjuntos de datos de fuentes diversas basados en redes neuronales profundas y técnicas de aprendizaje autosupervisado.

El concepto de modelo fundacional

Los modelos fundacionales (FM) son grandes redes neuronales de aprendizaje profundo entrenadas con enormes conjuntos de datos que han cambiado la forma en que los científicos de la computación abordan el aprendizaje automático (ML). En lugar de desarrollar inteligencia artificial (IA) desde cero, los científicos de datos utilizan el modelo subyacente como punto de partida para desarrollar modelos de aprendizaje automático que respalden nuevas aplicaciones de manera más rápida y rentable. El término modelo fundacional fue acuñado por investigadores para describir modelos de aprendizaje automático entrenados con una amplia gama de datos generalizados y no etiquetados, capaces de realizar una variedad de tareas generales, como comprender el lenguaje, generar texto e imágenes y mantener conversaciones en lenguaje natural.

Lea también: Las naciones que construyen sus propios modelos de IA aumentan la creciente demanda de chips de Nvidia

Qué hace único al modelo base

Una característica única del modelo fundacional es su adaptabilidad. Estos modelos pueden realizar una variedad de tareas diferentes con un alto grado de precisión basándose en indicaciones de entrada. Algunas tareas incluyen procesamiento de lenguaje natural (PLN), respuesta a preguntas y clasificación de imágenes. La escala y naturaleza genérica de los FM los diferencia de los modelos tradicionales de aprendizaje automático, que normalmente realizan tareas específicas, como analizar emociones en texto, clasificar imágenes y predecir tendencias.

El modelo fundacional se puede utilizar como modelo base para desarrollar aplicaciones posteriores más especializadas. Estos modelos son la culminación de más de una década de trabajo de desarrollo, y como resultado siguen creciendo en tamaño y complejidad.

Lo que el modelo base puede hacer

Procesamiento del lenguaje: Estos modelos tienen una capacidad extraordinaria para responder preguntas en lenguaje natural e incluso pueden escribir guiones cortos o artículos basados en indicaciones. También pueden traducir idiomas utilizando tecnología de PLN.

Comprensión visual: Los FM destacan en visión artificial, especialmente en el reconocimiento de imágenes y objetos físicos. Es probable que estas funciones se utilicen en aplicaciones como la conducción autónoma y la robótica. Otra función es generar imágenes introduciendo texto, así como editar fotos y videos.

Generación de código: El modelo fundacional puede generar código informático en una variedad de lenguajes de programación a partir de entradas en lenguaje natural. También se pueden usar los FM para evaluar y depurar código.

Facilitando la IA: Los modelos de IA generativa utilizan la entrada humana para aprender y mejorar los resultados predictivos. Una aplicación importante pero a veces pasada por alto de estos modelos es su capacidad para apoyar la toma de decisiones humana. Los usos potenciales incluyen diagnósticos clínicos, sistemas de apoyo a la toma de decisiones y análisis para desarrollar nuevas aplicaciones de IA mediante el ajuste fino de los modelos fundacionales existentes.

Lea también: La técnica del termómetro podría reducir el exceso de confianza en los modelos de IA