• Fei-Fei Li est une professeure très renommée dans le domaine de l’IA, d’abord connue pour son travail sur le projet ImageNet.
  • Fei-Fei Li a apporté des contributions significatives à l’industrie de l’IA grâce à son leadership au Google AI China Centre et au développement de produits d’IA influents.
  • La nouvelle aventure de Fei-Fei Li se concentre sur « l’intelligence spatiale », visant à faire progresser la compréhension de l’IA sur la manière dont les machines interagissent avec le monde, ce qui pourrait conduire à de nouvelles percées dans le domaine de l’IA.

Fei-Fei Li, professeure renommée à l’Université de Stanford, a récemment annoncé le lancement d’une nouvelle entreprise d’IA, ce qui a attiré beaucoup d’attention dans le monde de la tech. Il s’agit également du premier projet de startup dans lequel elle s’est directement impliquée depuis qu’elle a quitté Google et est revenue à Stanford en 2018. Ce blog parlera brièvement des explorations et des contributions de Fei-Fei Li au domaine de l’IA, ainsi que de son nouveau parcours entrepreneurial.

Œuvre de renom: ImageNet

Fei-Fei Li est née en Chine en 1976 et a déménagé aux États-Unis pour poursuivre ses études. Elle a obtenu son doctorat en informatique à l’Université de Stanford, où elle est restée au sein du corps professoral. En tant que professeure au département d’informatique de Stanford et codirectrice de l’Institut d’intelligence artificielle centrée sur l’humain (HAI) de Stanford, les recherches et l’enseignement de Fei-Fei Li dans le domaine de l’IA sont très estimés.

En 2005, Fei-Fei Li venait de recevoir son doctorat en génie électrique de Caltech. Elle a lancé le projet ImageNet avec l’une de ses étudiants diplômés. Ce projet a marqué le début de sa carrière universitaire et sa contribution la plus importante à l’industrie de l’IA à ce jour.

ImageNet est une vaste base de données d’images contenant plus de 15 millions d’images haute définition annotées couvrant 22 000 catégories, un énorme ensemble de données qui constitue une riche ressource pour l’entraînement des modèles d’apprentissage profond pour l’intelligence artificielle. Par la suite, elle et ses étudiants ont lancé le défi ImageNet, qui se tient chaque année depuis 2010 pendant 14 ans, et qui est devenu aujourd’hui l’événement le plus prestigieux dans le domaine de la vision par ordinateur.

Lire aussi: Qui est Varun Banka ? Le cofondateur d’Atlan est obsédé par les données

Empreintes dans l’industrie de l’IA

Pendant son mandat en tant que scientifique en chef de Cloud AI chez Google, Fei-Fei Li a combiné sa profonde accumulation académique avec des applications pratiques tout en impulsant la création du Google AI China Centre. L’établissement de ce centre est une reconnaissance de l’influence personnelle de Fei-Fei Li et de l’essor de la Chine dans le domaine de l’IA. Sous sa direction, le Google AI China Centre est devenu un pont reliant l’Orient et l’Occident en matière de recherche et de coopération en IA, favorisant l’échange et le progrès commun de la technologie mondiale de l’IA.

L’exploration du monde industriel par Fei-Fei Li ne se limite pas à cela. Elle a également dirigé l’équipe pour lancer une série de produits d’IA influents, notamment AutoML, Contact Centre AI, Dialogflow Enterprise, et bien d’autres. Ces produits changent le mode de fonctionnement des entreprises et la vie quotidienne des gens à l’échelle mondiale. AutoML permet aux développeurs non professionnels de former des modèles d’apprentissage automatique personnalisés, Contact Centre AI améliore l’efficacité du service client grâce à la technologie de traitement du langage naturel, et Dialogflow Enterprise fournit un soutien puissant pour la construction de systèmes de conversation intelligents.

Lire aussi: Qui est Paul Graham ? Cofondateur de Y Combinator, auteur acclamé et défenseur de l’open source

Parcours entrepreneurial: l’intelligence spatiale

La nouvelle entreprise de Fei-Fei Li, qui se concentre sur le développement de « l’intelligence spatiale », a bouclé un tour de financement d’amorçage auprès de a16z et de RadicalVentures. RadicalVentures est un fonds indépendant axé sur l’intelligence artificielle et les innovations connexes, enregistré au Canada et investi par des scientifiques de premier plan dans le domaine de l’IA, tels que Jeff Hinton et Fei-Fei Li, dès sa création.

La nouvelle entreprise axée sur « l’intelligence spatiale » est également en phase avec l’orientation des applications de l’IA que Fei-Fei Li a fréquemment mentionnée à de nombreuses reprises récemment.

Fei-Fei Li a déclaré: « Les progrès de la compréhension de l’intelligence spatiale par l’IA catalysent l’apprentissage robotique, nous rapprochant de l’objectif de permettre à l’IA d’interagir avec le monde. » Selon elle, l’exploration de l’intelligence spatiale est une étape cruciale dans le développement de l’IA.

Lors de son intervention à TED, Fei-Fei Li a montré l’image d’un chat avec la patte tendue poussant un verre vers le bord d’une table. En une fraction de seconde, a-t-elle dit, le cerveau humain peut évaluer la géométrie de ce verre, sa position dans l’espace tridimensionnel, sa relation avec la table, le chat et tout le reste, puis prédire ce qui va se passer et prendre des mesures pour l’arrêter. Cela démontre de manière éclatante le potentiel de l’intelligence spatiale.

Elle souligne que le cerveau humain est capable d’évaluer instantanément la géométrie d’un verre, sa position dans l’espace tridimensionnel et sa relation avec des objets tels que des tables et des chats, et de prédire ce qui pourrait arriver ensuite. Ce processus implique non seulement la perception visuelle, mais aussi des capacités de raisonnement et de prise de décision approfondies.

Image de l'article
Fei-Fei Li s'exprime lors de la session 2 de TED2024

Elle décrit l’intelligence spatiale comme la compréhension des relations entre les objets et la réalisation de nouvelles découvertes ou prédictions à partir de celles-ci. Il s’agit d’une intelligence de vision par ordinateur plus avancée que la reconnaissance visuelle traditionnelle, une recherche qui synthétise les résultats de travaux dans de multiples domaines, tels que les grands modèles de langage naturel, la robotique et la vision par ordinateur, où les machines peuvent effectuer un raisonnement visuel plus complexe comme les humains, et ainsi prendre des actions plus pertinentes.

Ces recherches devraient non seulement favoriser le développement de la robotique, mais aussi apporter des capacités d’interaction et des scénarios d’application plus riches pour l’IA.