De Midjourney à DALL·E 2, voici un aperçu des meilleurs outils d'IA pour la génération d'images

Jean Delaunay

De Midjourney à DALL·E 2, voici un aperçu des meilleurs outils d’IA pour la génération d’images

Les capacités des outils de génération d’images d’intelligence artificielle (IA) se sont développées à un rythme terrifiant – voici un aperçu de certains des meilleurs du marché.

S’il existe une expression à la mode en 2023, c’est bien « l’intelligence artificielle générative ».

L’explosion d’intérêt pour le chatbot ChatGPT d’OpenAI a ouvert la voie à une année au cours de laquelle des millions de personnes ont commencé à utiliser pour la première fois des outils d’IA générative.

Bien que des articles entiers ou des copies d’examen puissent être générés par une simple invite de texte, les invites de texte peuvent également être utilisées pour générer des images. De nombreuses plates-formes ont vu le jour permettant aux utilisateurs de créer des œuvres d’art, des affiches, des logos, des présentations et des images photoréalistes en les nourrissant de quelques mots seulement.

Ils peuvent le faire grâce à l’apprentissage automatique. Les réseaux de neurones sont formés sur des ensembles de données massifs, apprenant à identifier des modèles et des caractéristiques dans les images. L’algorithme utilise ensuite ces connaissances acquises pour prédire ce que recherche une invite textuelle.

Nous examinons certains des outils de génération d’images les plus populaires disponibles aujourd’hui. Avant de plonger et d’utiliser les plateformes, il convient de prêter attention à la situation des droits d’auteur autour des images générées par l’IA. Un certain nombre de poursuites sont déjà en cours, des artistes réclamant des dommages-intérêts à des entreprises dont les plates-formes d’IA, selon eux, ont été formées sur leur matériel protégé par le droit d’auteur.

Jetons un coup d’œil à cinq des meilleurs générateurs d’images disponibles aujourd’hui.

À mi-parcours

Rapide: « Un mage puissant jetant un sort »

À mi-parcours/Luke Hurst
L’idée de Midjourney d’un mage jetant un sort

L’un des premiers générateurs d’images IA à prendre de l’ampleur, Midjourney a attiré des millions d’utilisateurs sur sa plate-forme, époustouflés par ses capacités et séduits par son essai gratuit. Cet essai gratuit n’existe plus, vous devrez donc payer un abonnement maintenant pour l’essayer par vous-même, avec des prix à partir de 8 $ (9,33 €) par mois.

Le processus peut être fastidieux, car il fonctionne via Discord plutôt que sur une plate-forme autonome. Avec quelques essais et erreurs, ou en prenant des leçons des nombreux guides d’incitation disponibles en ligne, vous verrez rapidement à quel point Midjourney est puissant, créant des images photoréalistes, des œuvres d’art, des dessins animés ou des croquis à votre guise.

Pas étonnant qu’il compte déjà plus de 15 millions d’utilisateurs.

DALL·E 2

Rapide: « Peinture d’un avion décollant au crépuscule dans le goût de Vincent van Gogh. »

DALLE2/Luc Hurst
Et si les avions avaient existé à l’époque de Van Gogh ?

De la société à l’origine du très populaire ChatGPT, DALL·E 2 d’OpenAI est un autre outil de création d’images populaire.

Les utilisateurs peuvent générer un certain nombre d’images avec le forfait gratuit et devront s’inscrire à un forfait payant pour le faire en masse. La plateforme compte des millions d’utilisateurs, même si elle ne semble pas fonctionner aussi bien que Midjourney pour les images de style photoréaliste. Ce dans quoi il excelle, ce sont les œuvres d’art, avec le don de copier le style de peintres célèbres.

Et tout comme GPT-4 d’OpenAI alimente le chatbot IA du moteur de recherche Microsoft Bing, DALL·E 2 alimente également l’outil de génération d’images de Bing.

DreamStudio (Diffusion Stable)

Rapide: « Une tasse de thé fumante sur une table rustique en bois. Les arbres sont visibles à travers une fenêtre en arrière-plan . »

DreamStudio/Luke Hurst
Stable Diffusion est l’un des générateurs d’images les plus puissants

Un autre des premiers grands succès, Stable Diffusion est un modèle de génération d’images populaire, avec un outil gratuit sur le navigateur Web. DreamStudio utilise le modèle Stable Diffusion et dispose d’une multitude d’options et d’une interface utilisateur professionnelle.

Lorsque vous vous inscrivez, vous obtenez un certain nombre de crédits gratuits, et vous devrez ensuite payer pour les recharger. Les résultats sont impressionnants, surtout lors de la génération de visages humains – même si, comme tous ces générateurs d’images, il semble y avoir un problème particulier avec les mains humaines.

Rêve par WOMBO

Rapide: « Station spatiale extraterrestre »

WOMBO/Luke Hurst
Les créations Dream by WOMBO sont oniriques

Destiné à la génération d’art, comme les autres plateformes, il vous suffit de coller une simple invite de texte et il fournira des images imaginées par les algorithmes. Comme son nom l’indique, les images qu’il produit sont quelque peu oniriques, avec des résultats abstraits et souvent effrayants.

Avec des dizaines de styles artistiques parmi lesquels choisir (y compris des choses comme le « bad trip » ou le « steampunk »), c’est un véritable terrain de jeu pour la création artistique. Il est disponible sous forme d’application Web et d’application mobile.

Toile

Rapide: « Homme conduisant une supercar sur une route avec la Tour Eiffel en arrière-plan. »

Canva/Luke Hurst
On ne sait pas pourquoi l’homme se penche hors de la voiture

La plate-forme de conception graphique populaire, largement utilisée pour créer des publications et des présentations sur les réseaux sociaux, s’est lancée à deux pieds dans l’IA générative.

Nous incluons celui-ci comme mention spéciale car ses capacités à générer les types de médias susmentionnés sont vraiment impressionnantes. Il dispose également d’une IA de création d’images gratuite qui est peut-être un peu moins raffinée pour le moment.

Il a des règles assez strictes concernant les types d’images qu’il va créer. Par exemple, il a refusé de représenter Emmanuel Macron conduisant une Ferrari sur les Champs-Élysées, nous avons donc dû nous contenter d’un « homme conduisant une supercar sur une route avec la Tour Eiffel en arrière-plan ». Il semble qu’il soit encore en phase de travail.

Laisser un commentaire

un × quatre =