Google, Elon Musk et Mark Zuckerberg affirment que leur IA est open source, mais une nouvelle définition pourrait remettre en question cette idée.
Les entreprises d’intelligence artificielle générative (IA), comme Llama de Meta ou Grok d’Elon Musk, affirment qu’elles sont open source. Mais peu de gens s’accordent sur ce qu’est l’IA open source.
Une nouvelle définition pratique de ce que signifie le terme IA pourrait changer cela et vient d’être publiée par l’Open Source Initiative (OSI), les gardiens autoproclamés du terme.
Open source signifie généralement que le code source du logiciel est disponible pour que chacun dans le domaine public puisse l’utiliser, le modifier et le distribuer.
La définition open source de l’OSI stipule qu’il doit également respecter 10 critères, notamment disposer d’un moyen bien connu d’obtenir le code source à un coût raisonnable ou gratuitement, ne pas être discriminatoire et la licence ne pas restreindre d’autres logiciels.
Mais les systèmes d’IA sont plus difficiles à évaluer selon les 10 points de l’OSI et il existe donc une nouvelle définition spécifique de l’IA.
Quelle est la définition de l’open source ?
La définition de l’IA open source stipule qu’elle peut être utilisée pour n’importe quelle raison sans obtenir l’autorisation de l’entreprise, et les chercheurs devraient pouvoir voir librement comment le système fonctionne.
Il stipule également que le système peut être modifié à n’importe quelle fin, y compris pour changer son rendement et partager le système pour que d’autres puissent l’utiliser avec ou sans modifications pour quelque raison que ce soit.
La définition stipule que les entreprises d’IA doivent également être transparentes sur les données utilisées pour former le système, le code source utilisé pour former et exécuter le système et les pondérations – les paramètres numériques qui influencent les performances d’un modèle d’IA.
C’est là que réside le problème. OpenAI, malgré son nom, est une solution à code source fermé, dans la mesure où ses algorithmes, ses modèles et ses ensembles de données sont gardés secrets.
Mais les modèles de Meta, Grok et Google, qui se disent open source, ne le sont pas vraiment non plus, si l’on s’en tient à la définition de l’OSI. En effet, les entreprises ne sont pas transparentes quant aux données utilisées pour entraîner les poids, ce qui peut entraîner des problèmes de droits d’auteur et des questions éthiques quant à la possibilité que les données soient biaisées.
L’OSI reconnaît que le partage d’ensembles complets de données de formation peut être difficile et n’est donc pas si clair ou noir. Elle ne disqualifie donc pas le développement d’IA open source de la catégorie « open source ».
« Lavage à l’air libre »
La définition a été élaborée pendant plusieurs années et devra probablement être mise à jour à mesure que l’IA progresse.
L’OSI a élaboré cette définition pratique en consultant un groupe de 70 chercheurs, avocats, décideurs politiques, militants et représentants de grandes entreprises technologiques telles que Microsoft, Meta et Google.
« Cette définition deviendra une ressource précieuse pour lutter contre la pratique généralisée du « openwashing » qui devient de plus en plus répandue », ont déclaré les représentants de Mozilla Ayah Bdeir, Imo Udom et Nik Marda dans un communiqué envoyé à L’Observatoire de l’Europe Next.
Ils ont expliqué que le « surlavage » était le fait de promouvoir des modèles non ouverts (ou même des modèles ouverts comme Llama 3 de Meta) comme des options « open source » de premier plan sans contribuer aux biens communs.
« Les chercheurs ont montré que « les conséquences de l’open-washing sont considérables » et affectent l’innovation, la recherche et la compréhension publique de l’IA », ont-ils ajouté.
Aucun pouvoir pour faire respecter la définition
« Nous sommes les gardiens, les responsables de la définition, mais nous n’avons pas vraiment de pouvoirs forts pour la faire respecter », a déclaré Stefano Maffulli, directeur exécutif de l’OSI, dans une interview à L’Observatoire de l’Europe Next en mars.
Il a ajouté que les juges et les tribunaux du monde entier commencent à reconnaître que la définition de l’open source est importante, en particulier lorsqu’il s’agit de fusions mais aussi de réglementation.
Les pays du monde entier finalisent actuellement la manière dont ils réglementeront l’IA et les logiciels open source sont un sujet de discorde.
« La définition open source sert de barrière pour identifier la publicité mensongère », a déclaré Maffulli.
« Si une entreprise dit qu’elle est open source, elle doit porter les valeurs que la définition de l’open source véhicule. Sinon, c’est juste confus. »