• Una nueva investigación ha descubierto que las técnicas populares de “olvido” que hacen que los modelos de IA olviden datos incorrectos específicos también pueden degradar significativamente el rendimiento de los modelos, a veces volviéndolos inutilizables.
  • Los investigadores señalan que actualmente no existe un método de “olvido” eficaz que permita a los modelos olvidar datos específicos sin una pérdida significativa de la utilidad del modelo.

NUESTRA OPINIÓN
Las técnicas de “olvido” para modelos de IA están diseñadas para hacer que los modelos olviden información específica y no deseada aprendida en los datos de entrenamiento, como datos privados sensibles o material protegido por derechos de autor. El estudio encuentra que las técnicas actuales de “olvido” pueden perjudicar su capacidad para responder preguntas básicas, lo que lleva a una disminución del rendimiento del modelo. Los investigadores concluyen que actualmente no existe un método de “olvido” eficaz que permita a los modelos olvidar datos específicos sin una pérdida significativa de la utilidad del modelo.

-Rae Li, reportero de BTW

Lo que sucedió

Las técnicas de “olvido”en los modelos de IA permiten que el modelo olvide información específica y no deseada aprendida de los datos de entrenamiento, como datos privados sensibles o material protegido por derechos de autor. Los investigadores encuentran que, si bien estas técnicas pueden hacer que los modelos olviden cierta información, también pueden perjudicar el rendimiento del modelo, especialmente para responder preguntas básicas. El estudio utiliza una prueba de referencia llamada MUSE para evaluar el efecto de “olvido” de diferentes algoritmos, y encuentra que si bien estas técnicas hicieron que los modelos olvidaran información específica, también reducen la utilidad general de los modelos.

El estudio, realizado por investigadores de la Universidad de Washington, la Universidad de Princeton, la Universidad de Chicago, la Universidad del Sur de California yGoogle, prueba ocho algoritmos diferentes disponibles públicamente y encuentra que estas técnicas de “olvido” hacen que los modelos olviden datos específicos, como los libros de Harry Potter, al mismo tiempo que afectan la adquisición de conocimientos relevantes por parte de los modelos. Los investigadores señalan que diseñar métodos de olvido eficaces es un desafío porque el conocimiento está entrelazado en el modelo. Por ejemplo, un modelo puede haber aprendido tanto los libros de Harry Potter como el contenido gratuito de la wiki de Harry Potter, y al intentar eliminar los libros de Harry Potter, esto también influirá en el conocimiento del modelo sobre la wiki de Harry Potter. Los investigadores creen que aún no se ha encontrado una solución a este problema y se necesita más investigación.

Lea también:¿Para qué se utilizan las salas de servidores y sus principales proveedores?

Lea también:El avance de HP en soluciones de IA accesibles

Por qué es importante

Con la adopción generalizada de la tecnología de IA, se ha vuelto fundamental saber cómo manejar y gestionar la información sensible en los datos de entrenamiento. Las técnicas de “olvido” están diseñadas para permitir que los modelos de IA eliminen u olviden información específica de sus datos de entrenamiento, lo cual es importante en términos de protección de la privacidad, cumplimiento de las leyes de derechos de autor y respuesta a las solicitudes de eliminación de datos.

Sin embargo, el estudio sugiere que las técnicas de “olvido” existentes, si bien permiten que los modelos de IA olviden información no deseada, pueden perjudicar el rendimiento del modelo, particularmente en su capacidad para responder preguntas básicas. Esto sugiere que, si bien las técnicas de “olvido” son teóricamente atractivas, pueden tener consecuencias no deseadas que afectan la fiabilidad y utilidad de los modelos de IA.

La importancia de este mensaje es, por lo tanto, que destaca la necesidad de una investigación e innovación más profundas en el desarrollo e implementación de tecnologías de “olvido” para garantizar que los sistemas de IA sigan siendo eficientes y precisos.