La start-up française s’inquiète également du manque de diversité dans les modèles de formation linguistique.
L’Europe manque de centres de données pour former des modèles d’intelligence artificielle qui répondent à la demande actuelle, a averti aujourd’hui (14 juin) un responsable de la société française d’IA MistralAI.
« Nous atteignons la capacité maximale ; nous devons construire des centres de données et garantir qu’il y a suffisamment d’électricité pour répondre à l’ampleur actuelle du développement de l’IA. Il y a énormément de travail à faire », a déclaré Audrey Herblin-Stoop, responsable des affaires publiques chez MistralAI, lors d’une conférence organisée par la Cour des comptes européenne (CCE).
MistralAI, fondée il y a un an, a utilisé les installations de supercalculateurs ouvertes par la Commission européenne pour entraîner ses modèles.
« L’accès à l’infrastructure est important, sans cela, vous ne pouvez pas construire de grands modèles de langage. Nous pourrions former les premiers sur (le supercalculateur européen) Leonardo. Nous avons eu la chance de ne pas nous voir bloquer l’accès à l’informatique, mais cela permettra viennent pour d’autres entreprises. Les volumes nécessaires à l’IA sont incroyables », a-t-elle ajouté.
La société a annoncé en février dernier un nouveau grand modèle de langage destiné à rivaliser avec ChatGPT d’OpenAI. Le mannequin, baptisé Mistral Large, parle couramment le français, l’anglais, l’allemand, l’espagnol et l’italien. Cependant, son partenariat stratégique avec Microsoft, qui envisage d’investir 15 millions d’euros dans Mistral AI, fait l’objet d’un examen minutieux de la Commission européenne.
Différentes échelles
Les remarques de Mistral interviennent alors que la Cour des comptes européenne avertit dans un rapport publié le mois dernier que la Commission européenne doit investir davantage dans l’intelligence artificielle si elle veut réaliser ses ambitions et être à égalité avec les États-Unis et la Chine.
Réagissant au rapport, Killian Gross, responsable du développement et de la coordination de la politique en matière d’IA à la Commission, a déclaré que les entreprises européennes n’ont pas « la puissance de feu financière » dont disposent les géants américains tels que Microsoft.
« Nous sommes dans un autre ordre de grandeur. Nous ne pouvons pas rattraper notre retard aussi rapidement, mais ce n’est pas une raison pour être frustré – c’est une raison pour renforcer nos efforts », a déclaré Gross, s’exprimant lors de la même conférence.
Dragos Tudorache, le législateur qui a rédigé la position du Parlement européen sur la loi sur l’IA, a averti que malgré le potentiel d’harmonisation qu’offre le nouveau cadre juridique, les approches des États membres varient considérablement sur des questions telles que les compétences.
« Permettre l’adoption de l’IA est quelque chose que les États membres doivent mettre en place. Mais les stratégies nationales voient un paysage très dispersé. Et le contenu des stratégies n’est pas le même », a déclaré Tudorache lors de la conférence.
Accès aux données
L’accès aux données est un autre facteur important pour garantir que les entreprises d’IA en Europe puissent se développer et continuer à former leurs modèles, a déclaré Herblin-Stoop de MistalAI. MistalAI forme ses modèles en italien, français et espagnol, mais elle a besoin d’accéder à de gros volumes de données dans ces langues pour garantir la pertinence de ses systèmes.
« Nous devons trouver un meilleur moyen d’accéder aux données pour que les autres cultures soient représentées. Le contenu viendra à l’avenir des États-Unis et de la Chine. Mais en tant qu’entreprise mondiale, nous nous soucions de créer des modèles solides dans des langues autres que l’anglais », a-t-elle ajouté.
La loi sur l’IA, des règles européennes strictes visant à réglementer les systèmes d’IA à haut risque, a été signée cette semaine et paraîtra au Journal officiel de l’UE dans 20 jours. Les règles générales sur l’IA s’appliqueront un an après leur entrée en vigueur, en mai 2025, et les obligations pour les systèmes à haut risque dans trois ans.