Google lance le modèle d'IA rival ChatGPT, Gemini, qui, selon lui, est formé pour se comporter comme des humains

Jean Delaunay

Google lance le modèle d’IA rival ChatGPT, Gemini, qui, selon lui, est formé pour se comporter comme des humains

Dans le but de supprimer ChatGPT d’OpenAI, Google affirme que sa nouvelle IA Gemini peut mieux raisonner que ses rivaux existants.

Google a franchi une nouvelle étape dans l’intelligence artificielle (IA) mercredi avec le lancement du projet Gemini, un modèle d’IA entraîné à se comporter de manière humaine, susceptible d’intensifier le débat sur les promesses et les périls potentiels de la technologie.

Le déploiement se déroulera par phases, avec des versions moins sophistiquées de Gemini appelées « Nano » et « Pro » étant immédiatement intégrées au chatbot Bard de Google, alimenté par l’IA, et à son smartphone Pixel 8 Pro.

Avec l’aide de Gemini, Google promet que Bard deviendra plus intuitif et meilleur dans les tâches impliquant une planification.

Sur le Pixel 8 Pro, Gemini pourra résumer rapidement les enregistrements réalisés sur l’appareil et fournir des réponses automatiques sur les services de messagerie, à commencer par WhatsApp, selon Google.

Les plus grandes avancées de Gemini n’interviendront qu’au début de l’année prochaine, lorsque son modèle Ultra sera utilisé pour lancer « Bard Advanced », une version améliorée du chatbot qui ne sera initialement proposée qu’à un public test.

Dans un premier temps, l’IA ne fonctionnera qu’en anglais dans le monde entier, même si les dirigeants de Google ont assuré aux journalistes lors d’un point de presse que la technologie n’aurait aucun problème à se diversifier à terme dans d’autres langues.

Basé sur une démonstration de Gemini pour un groupe de journalistes, le « Bard Advanced » de Google pourrait être capable d’un multitâche IA sans précédent en reconnaissant et en comprenant simultanément des présentations contenant du texte, des photos et des vidéos.

Gemini finira également par être intégré au moteur de recherche dominant de Google, bien que le moment de cette transition n’ait pas encore été précisé.

« Une nouvelle ère » pour Google

« Il s’agit d’une étape importante dans le développement de l’IA et le début d’une nouvelle ère pour nous chez Google », a déclaré Demis Hassabis, PDG de Google DeepMind, la division IA derrière Gemini.

Google a prévalu sur d’autres soumissionnaires, y compris la société mère de Facebook, Meta, pour acquérir la société DeepMind basée à Londres il y a près de dix ans, et l’a depuis fusionné avec sa division « Brain » pour se concentrer sur le développement de Gemini.

Nous avons fait énormément de progrès dans ce qu’on appelle la factualité avec Gemini. Gemini est donc notre meilleur modèle à cet égard. Mais cela reste, je dirais, un problème de recherche non résolu.

Eli Collins

Vice-président, Google DeepMind

Les capacités de résolution de problèmes de cette technologie sont présentées par Google comme étant particulièrement compétentes en mathématiques et en physique, alimentant ainsi l’espoir des optimistes de l’IA qu’elle pourrait conduire à des percées scientifiques qui amélioreraient la vie des humains.

Mais un camp opposé au débat sur l’IA s’inquiète du fait que la technologie finisse par éclipser l’intelligence humaine, entraînant la perte de millions d’emplois et peut-être des comportements encore plus destructeurs, comme l’amplification de la désinformation ou le déclenchement du déploiement d’armes nucléaires.

« Nous abordons ce travail avec audace et responsabilité », a écrit le PDG de Google, Sundar Pichai, dans un article de blog.

« Cela signifie être ambitieux dans nos recherches et rechercher les capacités qui apporteront d’énormes avantages aux personnes et à la société tout en intégrant des garanties et en travaillant en collaboration avec les gouvernements et les experts pour faire face aux risques à mesure que l’IA devient plus performante ».

L’arrivée de Gemini est susceptible de faire monter la barre dans une compétition d’IA qui s’est intensifiée au cours de l’année écoulée, avec la startup de San Francisco OpenAI et son rival de longue date dans l’industrie, Microsoft.

Soutenu par la puissance financière et la puissance de calcul de Microsoft, OpenAI était déjà en train de développer son modèle d’IA le plus avancé, GPT-4, lorsqu’il a publié l’outil gratuit ChatGPT à la fin de l’année dernière.

Ce chatbot alimenté par l’IA est devenu célèbre dans le monde entier, faisant le buzz sur la promesse commerciale de l’IA générative et faisant pression sur Google pour qu’il repousse Bard en réponse.

Surfer sur la vague de l’IA générative

Au moment même où Bard arrivait, OpenAI a publié GPT-4 en mars et a depuis intégré de nouvelles fonctionnalités destinées aux consommateurs et aux entreprises, notamment une fonctionnalité dévoilée en novembre qui permet au chatbot d’analyser les images.

Elle est en compétition commerciale avec d’autres startups d’IA rivales telles qu’Anthropic et même avec son partenaire Microsoft, qui détient les droits exclusifs sur la technologie OpenAI en échange des milliards de dollars qu’il a investis dans la startup.

Jusqu’à présent, l’alliance a été une aubaine pour Microsoft, qui a vu sa valeur boursière grimper de plus de 50 % depuis le début de l’année, principalement en raison de la conviction des investisseurs que l’IA deviendra une mine d’or pour l’industrie technologique.

La société mère de Google, Alphabet, a également surfé sur la même vague avec une valeur marchande en hausse de plus de 500 milliards de dollars (460 milliards d’euros), soit environ 45 pour cent, depuis le début de l’année. Malgré l’anticipation entourant Gemini ces derniers mois, l’action d’Alphabet a légèrement baissé mercredi.

L’implication croissante de Microsoft dans OpenAI au cours de l’année écoulée, associée aux tentatives plus agressives d’OpenAI pour commercialiser ses produits, a fait naître des inquiétudes quant au fait que l’organisation à but non lucratif s’est éloignée de sa mission initiale de protéger l’humanité à mesure que la technologie progresse.

Ces inquiétudes se sont amplifiées le mois dernier lorsque le conseil d’administration d’OpenAI a brusquement licencié le PDG Sam Altman dans un différend portant sur des questions de confiance non divulguées. Après une réaction violente qui a menacé de détruire l’entreprise et d’entraîner un exode massif de talents en ingénierie de l’IA vers Microsoft, OpenAI a ramené Altman au poste de PDG et a remanié son conseil d’administration.

Avec la sortie de Gemini, OpenAI pourrait se retrouver à essayer de prouver que sa technologie reste plus intelligente que celle de Google.

« Je suis impressionné par ce dont il est capable », a déclaré Eli Collins, vice-président des produits de Google DeepMind, à propos de Gemini.

Lors d’une conférence de presse virtuelle, Google a refusé de partager le nombre de paramètres de Gemini – une mesure, mais pas la seule, de la complexité d’un modèle.

Un livre blanc publié mercredi décrit la version la plus performante de Gemini surpassant GPT-4 dans les examens à choix multiples, les mathématiques à l’école primaire et d’autres tests de référence, mais reconnaît les difficultés en cours pour amener les modèles d’IA à atteindre des compétences de raisonnement de plus haut niveau.

Certains informaticiens voient les limites de ce qui peut être fait avec les grands modèles de langage, qui fonctionnent en prédisant de manière répétée le mot suivant dans une phrase et sont enclins à commettre des erreurs connues sous le nom d’hallucinations.

« Nous avons fait beaucoup de progrès dans ce qu’on appelle la factualité avec Gemini. Gemini est donc notre meilleur modèle à cet égard. Mais c’est encore, je dirais, un problème de recherche non résolu », a déclaré Collins.

Laisser un commentaire

quatorze − neuf =