• Apple a publié un document technique détaillant les modèles utilisés pour Apple Intelligence, soulignant que ses données d'entraînement proviennent de sources responsables et qu'aucune donnée utilisateur privée n'est utilisée.
  • Il mentionne également qu'Apple filtre le code open source via des licences et utilise des ensembles de données publics pour entraîner ses modèles d'IA, tout en prenant des mesures pour réduire le risque que les modèles produisent du contenu indésirable.

NOTRE AVIS
Le document technique décrit le processus d'entraînement des modèles d'IA développés pour Apple Intelligence, en précisant que les modèles sont entraînés sur des ensembles de données publics et sous licence, garantissant qu'aucune donnée utilisateur privée n'a été utilisée, soulignant ainsi ses principes de respect de la vie privée et de développement responsable de l'IA.

-Rae Li, journaliste BTW

Que s'est-il passé

Apple a publié un document technique qui décrit le processus d'entraînement des modèles d'IA développés pour Apple Intelligence. Dans ce document, Apple réfute les allégations selon lesquelles elle adopterait une approche éthiquement discutable pour entraîner ses modèles d'IA, réitérant qu'elle n'utilise pas de données utilisateur privées, mais plutôt des données publiques et sous licence. Apple mentionne que ses ensembles de données de pré-entraînement incluent des données sous licence provenant d'éditeurs, des ensembles de données publics ou open source filtrés, et des informations publiques collectées par son robot d'exploration Web, Applebot. De plus, Apple insiste sur la protection de la vie privée des utilisateurs, précisant que le mélange de données ne contient aucune donnée utilisateur privée Apple.

Plus en détail, Apple révèle les sources des données d'entraînement pour ses modèles AFM (Apple Foundation Models), y compris des données Web publiques et des données sous licence provenant d'éditeurs non divulgués. Apple a également utilisé du code open source hébergé sur GitHub pour l'entraînement, notamment du code Swift, Python, C, Entitéive-C, C++, JavaScript, Java et Go. Pour améliorer les compétences mathématiques du modèle, Apple a spécifiquement inclus des questions et réponses mathématiques provenant de pages Web, de forums mathématiques, de blogs, de tutoriels et d'ateliers.

De plus, Apple a acquis des données supplémentaires, y compris des retours humains et des données synthétiques, pour affiner le modèle AFM et tenter de réduire le risque de comportement indésirable. Apple indique que son modèle est créé pour aider les utilisateurs à effectuer des activités quotidiennes sur leurs appareils Apple tout en respectant les valeurs fondamentales et les principes d'IA responsable d'Apple.

À lire aussi: Les employés de la vente au détail d'Apple obtiennent un contrat après une campagne syndicale

À lire aussi: Apple s'engage pour la sécurité de l'IA dans le cadre de l'initiative de la Maison Blanche

Pourquoi c'est important

Ce document montre comment Apple développe et entraîne ses modèles d'IA tout en protégeant la vie privée des utilisateurs. Dans le contexte actuel de préoccupations croissantes concernant la confidentialité et la sécurité des données, la déclaration claire d'Apple selon laquelle les données d'entraînement de ses modèles d'IA ne contiennent aucune donnée utilisateur privée contribue à renforcer la confiance des consommateurs dans les produits Apple.

De plus, l'accent mis par Apple sur la transparence des sources de données et les principes de développement responsable de l'IA constitue une référence positive pour l'industrie, démontrant comment des données ouvertes et autorisées peuvent être utilisées pour l'innovation technologique sans porter atteinte à la vie privée des utilisateurs. La divulgation par Apple des détails de l'entraînement de ses modèles d'IA fournit une référence importante pour la communauté technologique et les régulateurs.