- Apple ha publicado un documento técnico que detalla los modelos utilizados en Apple Intelligence, destacando que sus datos de entrenamiento provienen de fuentes responsables y que no se utilizan datos privados de los usuarios.
- También menciona que Apple filtra el código de fuente abierta mediante licencias y utiliza conjuntos de datos disponibles públicamente para entrenar sus modelos de IA, al tiempo que toma medidas para reducir el riesgo de que los modelos generen contenido inapropiado.
NUESTRA OPINIÓN
El documento técnico describe el proceso de entrenamiento de los modelos de IA que ha desarrollado para Apple Intelligence, dejando claro que los modelos se entrenan con conjuntos de datos públicos y con licencia, asegurando que no se utilizan datos privados de los usuarios, lo que enfatiza sus principios de respeto a la privacidad del usuario y desarrollo responsable de la IA.
-Rae Li, reportera de BTW
Lo que sucedió
Apple ha publicado un documento técnico que detalla el proceso de entrenamiento de los modelos de IA que desarrolló para Apple Intelligence. En el documento, Apple refuta las acusaciones de que adopta un enfoque éticamente cuestionable para entrenar sus modelos de IA, reiterando que no utiliza datos privados de los usuarios, sino que emplea datos públicos y con licencia. Apple menciona que sus conjuntos de datos de preentrenamiento incluyen datos con licencia de editores, conjuntos de datos públicos o de código abierto filtrados, e información disponible públicamente rastreada por su rastreador web, Applebot. Además, Apple enfatiza su protección de la privacidad del usuario, especificando que la mezcla de datos no contiene ningún dato privado de los usuarios de Apple.
Con más detalle, Apple revela las fuentes de datos de entrenamiento para sus modelos AFM (Apple Foundation Models), que incluyen datos web disponibles públicamente y datos con licencia de editores no revelados. Apple también utilizó código de fuente abierta alojado en GitHub para el entrenamiento, específicamente código en Swift, Python, C, Entidadive-C, C++, JavaScript, Java y Go. Para mejorar las habilidades matemáticas del modelo, Apple incluyó específicamente preguntas y respuestas matemáticas de páginas web, foros de matemáticas, blogs, tutoriales y talleres.
Además, Apple adquirió datos adicionales, incluyendo retroalimentación humana y datos sintéticos, para afinar el modelo AFM e intentar reducir el riesgo de comportamientos no deseados. Apple afirma que su modelo está creado para ayudar a los usuarios a realizar actividades cotidianas en sus productos Apple, siguiendo los valores fundamentales y los principios de IA responsable de Apple.
Lea también: Los trabajadores minoristas de Apple consiguen un contrato tras la presión sindical
Lea también: Apple se compromete con la seguridad de la IA en la iniciativa de la Casa Blanca
Por qué es importante
Este documento puede indicar cómo Apple desarrolla y entrena sus modelos de IA al tiempo que protege la privacidad del usuario. En el contexto actual de creciente preocupación por la privacidad y la seguridad de los datos, la clara declaración de Apple de que los datos de entrenamiento de sus modelos de IA no contienen ningún dato privado de los usuarios ayuda a aumentar la confianza de los consumidores en los productos Apple.
Además, el énfasis de Apple en la transparencia de las fuentes de datos y los principios de desarrollo responsable de la IA establece un punto de referencia positivo para la industria, demostrando cómo se pueden utilizar datos abiertos y autorizados para la innovación tecnológica sin infringir la privacidad del usuario. La divulgación por parte de Apple de los detalles del entrenamiento de modelos de IA proporciona una referencia importante para la comunidad tecnológica y los reguladores.

