Developed by Google Deepmind, the algorithm subtly changes the AI generation to make it detectable.

Jean Delaunay

Google rend son outil de filigrane pour le texte généré par l’IA open source

Développé par Google Deepmind, l’algorithme modifie subtilement la génération de l’IA pour la rendre détectable.

La technologie de Google permettant de filigraner le texte généré par l’intelligence artificielle (IA) est désormais accessible à tous.

SynthID est un outil développé par Google Deepmind, le laboratoire de la firme dédié à l’IA et il vient de devenir open-source.

Il fonctionne en introduisant de légères modifications au texte généré « en introduisant une signature statistique dans le texte généré », selon un article publié dans Nature..

Ces signatures « sont imperceptibles pour les humains », note Google dans un article sur le blog du géant de la Big Tech dédié aux développeurs.

Le processus de tatouage ne ralentit pas la génération et ne nécessite pas d’accéder au grand modèle de langage (LLM), « qui est souvent propriétaire », note l’article de Nature.

« Désormais, d’autres développeurs d’IA (générative) pourront utiliser cette technologie pour les aider à détecter si les sorties de texte proviennent de leurs propres (LLM), ce qui permettra à davantage de développeurs de créer plus facilement une IA de manière responsable », Pushmeet Kohli, vice-président. de la recherche chez Google DeepMind, a déclaré au MIT Technology Review.

L’entreprise a testé son outil de filigrane via son chatbot Gemini. Ils ont analysé environ 20 millions de réponses filigranées et non filigranées du chat et n’ont noté aucune différence statistiquement significative dans les commentaires concernant leur qualité.

L’algorithme est actuellement déployé sur Gemini et Gemini Advanced car « on craint qu’il puisse contribuer à des problèmes de désinformation et d’attribution erronée », note le blog.

« Le filigrane est une technique permettant d’atténuer ces impacts potentiels ».

Selon les chercheurs, il offre « une détectabilité supérieure par rapport aux méthodes existantes », comme analyser la diversité et l’hétérogénéité d’un texte pour déterminer s’il a été généré par un modèle de langage ou par un humain.

C’est la méthode utilisée par exemple par GPTZero mais elle peut conduire à des faux positifs et négatifs.

Cependant, même SynthID-text n’est pas une méthode infaillible et le score a tendance à baisser si le texte est « entièrement réécrit ou traduit dans une autre langue ».

Deepmind a également développé des outils pour marquer les images et les vidéos générées par l’IA en incorporant un filigrane numérique directement dans les pixels d’une image ou dans chaque image d’une vidéo invisible à l’œil nu.

Le filigrane a été conçu pour résister aux manipulations courantes d’images et de vidéos, telles que le recadrage, le redimensionnement, la compression et l’ajout de filtres.

Laisser un commentaire

18 + 18 =