- Google intègre Gemini Nano, le plus petit de ses modèles d'IA, directement dans le client Chrome de bureau, à partir de Chrome 126.
- Google permet à de nombreuses API avancées de Chrome de traduire, sous-titrer et transcrire du texte dans le navigateur en utilisant son modèle Gemini.
Lors de la conférence des développeurs Google I/O 2024 mardi, Google a annoncé qu'il intégrait son plus petit modèle d'IA,Gemini Nano, directement dans le client Chrome de bureau, à partir de Chrome 126.
Le modèle d'IA Gemini Nano dans Chrome sur ordinateur
Gemini, qui se décline en 3 versions telles que Gemini Ultra, Gemini Pro et Gemini Nano, est la famille de modèles GenAI de nouvelle générationpromise depuis longtempspar Google, développée par les laboratoires de recherche en IA de Google, DeepMind et Google Research. Gemini Nano, un modèle « distillé » plus petit, fonctionne sur les appareils mobiles comme le Pixel 8 Pro. La société indique que ce sont les récents travaux sur la prise en charge de WebGPU et WASM dans Chrome qui permettent à ces modèles de fonctionner à une vitesse raisonnable sur une large gamme de matériel.
Lors d'un briefing précédant l'annonce de mardi, Jon Dahlke, directeur de la gestion des produits Chrome chez Google, a mentionné que des discussions étaient en cours avec d'autres fournisseurs de navigateurs pour implémenter cette capacité — ou une capacité comparable — dans leurs navigateurs respectifs également.
« Nous avons commencé à collaborer avec d'autres navigateurs et allons ouvrir un programme de prévisualisation anticipée pour les développeurs », a écrit Dahlke dans l'annonce de mardi. « Avec WebGPU, WASM et Gemini intégrés à Chrome, nous pensons que le Web EST prêt pour l'IA. »
À lire aussi:Le Gemini de Google devrait débarquer sur les téléphones Android l'année prochaine
À lire aussi:Un aperçu du Gemini d'Alphabet, le modèle d'IA qui vise à défier ChatGPT-4
Assistant d'écriture
Google active de nombreuses API avancées dans Chrome pour utiliser son modèle Gemini pour des tâches telles que la traduction, le sous-titrage et la transcription de texte directement dans le navigateur. Selon la société, cela permettra aux développeurs de tirer parti du modèle sur l'appareil pour leurs propres fonctionnalités d'IA. Google a l'intention d'utiliser cette capacité améliorée pour prendre en charge des fonctionnalités telles que l'outil « Aidez-moi à écrire » actuel de Workspace Lab dans Gmail.
Jusqu'à présent, il alimente quelques fonctionnalités sur les Pixel 8 Pro, Pixel 8 et Samsung Galaxy S24, notamment Summarize dans Recorder et Smart Reply dans Gboard. L'application Recorder, qui permet aux utilisateurs d'appuyer simplement sur un bouton pour enregistrer et transcrire de l'audio, propose désormais un résumé alimenté par Gemini de vos discussions enregistrées, interviews, présentations et autres segments.
Dahlke a déclaré lors de la keynote développeur à l'I/O: « Nous voulons maintenant vous donner accès aux modèles Gemini dans Chrome. Notre vision est de vous offrir les modèles d'IA les plus puissants dans Chrome pour atteindre des milliards d'utilisateurs sans vous soucier de l'ingénierie des invites, du réglage fin, de la capacité et du coût. Tout ce que vous avez à faire est d'appeler quelques API de haut niveau – traduire, sous-titrer, transcrire. C'est un grand changement pour le Web et nous voulons bien faire les choses. »

