Produire des images avec l’IA : Midjourney versus Firefly

Dans le domaine de la génération d’images par l’intelligence artificielle (IA), deux noms se distinguent : Firefly et Midjourney. Ces deux plateformes offrent des solutions intéressantes pour la création d’images, mais présentent également des différences notables dans leurs approches et leurs fonctionnalités. Nous vous proposons donc ici un petit comparatif entre ces deux poids lourds de l’IA.

Préambule

Il est vain de chercher à produire des images « réalistes » sur des sujets d’actualité avec l’IA. Certains s’y sont risqués mais la pratique doit être clairement bannie. La photographie d’information reste l’apanage des photojournalistes et l’IA ne produit que des images prétendument réelles ou inspirées de la réalité. Les images générées peuvent illustrer un document mais ne délivrent aucune information tangible et vérifiable. Il n’est pas question non plus de produire des images en lien avec l’activité d’une entreprise, il y a des photographes professionnels pour cela. La création d’images (et pas de photographies) avec l’IA est utile pour illustrer un sujet, certainement pas pour en délimiter les contours authentiques.

Deux approches différentes

Adobe Firefly cherche à se positionner comme une plateforme leader dans le domaine de la génération d’images par l’IA. Avec son algorithme avancé basé sur le deep learning, Firefly est capable de produire des images réalistes dans différents styles et contextes. La plateforme propose une interface plutôt conviviale qui permet aux utilisateurs de générer facilement des images personnalisées en quelques clics.

Midjourney se distingue par son approche novatrice de la génération d’images. Basée sur des techniques de traitement du langage naturel (NLP) et de génération de texte, la plateforme utilise principalement des descriptions textuelles (prompts) pour créer des images réalistes qui correspondent aux attentes des utilisateurs. Cette approche permet une personnalisation poussée et une flexibilité accrue dans la création d’images sur mesure.

Le match des interfaces : Les mots pour le dire

Firefly pour les pros ?

Firefly propose une interface qui semble plutôt complète et bien pensée, à la fois pour le novice et pour le professionnel. Les réglages sont nombreux et la personnalisation assez avancée. Une barre à gauche de l’écran vous permet de sélectionner : le format de votre image, le type d’image, de proposer une image de référence, de choisir un style, des effets, les couleurs, l’éclairage et les angles de prise de vue. Firefly est aussi pensé pour les photographes qui disposent de réglages plus professionnels : choix de l’ouverture du diaphragme, de la vitesse d’obturation et même de la focale (14, 20, 28, 35, 50, 80, 100, 200 et 300mm). On perçoit bien ici que Firefly est un produit Adobe conçu par l’entreprise qui équipe avec ses logiciels Lightroom et Photoshop la grande majorité des photographes du monde entier. Un champ en bas de l’écran, le bien nommé « prompt », vous permet de saisir le texte de votre demande. Les options choisies précédemment viennent automatiquement s’ajouter dans le champ.

Interface Firefly © innovated4

Midjourney pour les créatifs

Midjourney, que nous avons le bonheur de pouvoir tester depuis quelques semaines dans sa récente version alpha, est beaucoup plus sobre en matière d’interface. Auparavant, il fallait passer par Discord pour générer des images, il n’y avait pas d’interface. Midjourney ne propose que le strict minimum, à savoir : le format de l’image, le degré de créativité et le moteur de génération de l’image ainsi que la vitesse de production. Cette interface ultra simple doit être compensée par la qualité des prompts que vous allez insérer dans le champ « Imagine… ». Ces prompts, ces textes, peuvent (et doivent) être très précis et comporter des indications relatives à l’angle de prise de vue, la focale, le boitier utilisé, la couleur, l’éclairage, le type de pellicule si vous souhaitez un effet « argentique » sur vos photos…Tout est possible, mais il faudra l’exprimer clairement sous forme textuel (en anglais de préférence, mais cela fonctionne aussi en français). Midjourney est donc clairement plus accro au texte de votre prompt que Firefly. Il vous faudra donc trouver les mots pour le dire.

Interface Midjourney © innovated4

 

A ce stade de notre comparatif, Adobe Firefly paraît plus « professionnel ». Mais la sobriété de Midjourney n’est pas un handicap et nous allons rapidement le découvrir.

Qualité des images : Midjourney repasse largement en tête

L’IA et ses limites

En ce qui concerne la qualité des images générées, les deux plateformes offrent des résultats intéressants. Bien entendu, toutes deux restent en grande difficultés pour traiter certaines demandes. C’est le cas notamment lorsque vous demandez à l’IA de produire l’image d’une personne qui utilise ses mains ou ses pieds. Il n’est pas rare de compter plus de doigts ou de pieds que nécessaire ou d’observer des positions des membres parfaitement incongrues. Les yeux peuvent parfois être trop petits ou trop grands, étrangement surnaturels, difformes ou vairons. La répétition de motifs est aussi souvent assez mal gérée. Le réalisme n’est pas non plus toujours au rendez-vous concernant les objets du quotidien. Vous verrez apparaître des guitares à deux manches ou à 17 cordes, des roues de vélos étrangement rayonnées, des bouteilles difformes, des fourchettes inutilisables, des chaises à cinq pieds, des espaces inhabitables… Les textes bien visibles sur les livres, les affiches ou les produits seront souvent soit totalement effacés (Firefly) soit composés de glyphes sans signification (Midjourney). Des défauts bien visibles, parfois drôles, grotesques ou dérangeants peuvent donc apparaître sur les images générées par les deux plateformes.

Nous avons réalisé quelques images sur les deux plateformes en utilisant des prompts similaires et des réglages identiques. Comme vous pouvez le découvrir ci-après. Nous présentons à chaque fois l’image produite par Firefly, puis celle produite par Midjourney.

The cat battle

Image générée par Firefly qui montre un chat sur le rebord d'une fenêtre.
L’image du chat produite par Firefly est assez qualitative, presque trop et donc assez peu naturelle.

Image générée par Midjourney qui montre un chat sur le rebord d'une fenêtre.
L’image du chat produite par Midjourney est très réaliste et naturelle en ce qui concerne la pose.

Un hiver scandinave en noir et blanc

Image en noir et blanc générée par Firefly qui montre une femme scandinave devant un lac et la montagne en hiver.
Firefly produit ici une image de piètre qualité, très pixelisée et peu réaliste.

 

Image en noir et blanc générée par Midjourney qui montre une femme scandinave devant un lac et la montagne en hiver.
Midjourney soigne les détails et gère parfaitement la profondeur de champ et les lumières. Tout ici semble très naturel et parfaitement réaliste.

Battle of blondes at the golden hour

Image générée par Firefly qui montre une femme blonde sur le bord de la route près d'une voiture sous le soleil couchant.
Cette image générée par Firefly, présente de nombreux défauts et un style très « vintage ».

Image générée par Midjourney qui montre une femme blonde dans une voiture au soleil couchant.
Une fois encore Midjourney gère parfaitement les jeux de lumières, les détails et offre une image réaliste, convaincante et moderne. Une « golden hour » saisissante.

Des images médiocres pour Firefly

Firefly souhaite exceller dans la création d’images réalistes avec une grande précision dans les détails et les textures. Les images générées par Firefly veulent être indiscernables des photographies réelles, ce qui en ferait un choix idéal pour les projets nécessitant un haut niveau de réalisme. Malheureusement, entre l’ambition affichée et la réalité, il y a un gouffre. Comme vous pouvez le constater sur les images, Firefly souhaite effectivement produire des vues réalistes, mais au prix d’une qualité plus que médiocre et dans un style pour le moins « vintage », pour ne pas dire franchement ringard. C’est à se demander si la base d’images utilisée pour l’apprentissage de l’IA n’était pas constituée de photos issues de banques d’images des années 80. Sur le plan technique, les images sont aussi très pixelisées et trop compressées en format JPEG. La plupart d’entre-elles sont peu utilisables en dehors d’un affichage en ligne dans des dimensions très réduites. Inutile d’imaginer imprimer un poster à partir des images issues de Firefly.

Midjourney impressionne

De son côté, Midjourney se démarque par sa capacité à traduire efficacement des descriptions textuelles en images convaincantes. La plateforme est particulièrement efficace pour générer des images basées sur des concepts abstraits ou des idées complexes, offrant ainsi une grande liberté créative aux utilisateurs. Par ailleurs, la qualité des images produites est assez extraordinaire et nettement meilleure que son concurrent. Plus modernes, dans L’ère du temps, plus impactantes, les images produites par Midjourney sont aussi techniquement de qualité bien supérieure puisque les fichiers (au format PNG) sont beaucoup plus riches et détaillés. Revers de la médaille, ces fichiers plus volumineux sont aussi plus gourmands en terme de stockage. Mais disons-le clairement « il n’y a pas photo » entre les deux concurrents, Midjourney propose de très belles images, très exploitables voire même imprimables.

Une seule offre gratuite mais limitée

Firefly est le seul à proposer une offre gratuite, limitée cependant à 25 générations d’images par mois, avec la présence d’un filigrane. Cette offre finalement très limitée vous permettra de tester la plateforme mais certainement pas d’en faire usage à des fins professionnelles. Pour aller plus loin, vous devrez débourser 5,53 euros par mois ou être abonné à l’une des formules de la suite Adobe. Dans ce dernier cas, vous pourrez utiliser plus largement Firefly.

La qualité a un prix

Midjourney ne propose pas d’offre gratuite. L’abonnement « basic » à 10$ par mois vous permet de créer des images dans la limite de 3h30 d’utilisation mensuelle en mode rapide. Vos images seront visibles par l’ensemble de la communauté et vous ne pourrez effectuer que trois tâches en simultané. Le plan « standard » à 30$ permet de créer des images en illimité mais la génération de celles-ci sera plus lente. Vous bénéficiez ici de 15 heures de génération en mode rapide. Les plans « Pro » et « Mega » a respectivement 60 et 120$ vous permettent surtout de générer des images qui ne seront pas visibles par la communauté des utilisateurs et offrent plus de temps de génération en mode « rapide ». A l’usage, vous pouvez largement vous contenter du mode « relax », le plus lent, si vos besoins sont importants en quantité mais pas en terme de délais. Le fait que vos images soient exposées devant la communauté n’est pas un problème, des milliers d’images sont générées chaque jour et votre production sera noyée dans la masse. Si vos images sont superbes, la communauté pourra les gratifier, ce qui ne flattera que votre égo.

Midjourney, grand vainqueur

En conclusion, Firefly et Midjourney sont deux plateformes de génération d’images par l’IA qui offrent des solutions innovantes pour les besoins variés des utilisateurs. Alors que Firefly souhaite vouloir conquérir les créateurs d’images réalistes avec un haut niveau de contrôle et de personnalisation, Midjourney se distingue par sa capacité à traduire des descriptions textuelles en images convaincantes et nettement plus esthétiques avec une grande simplicité d’utilisation. En fonction des besoins spécifiques de chaque projet, les utilisateurs peuvent choisir la plateforme qui correspond le mieux à leurs attentes et à leurs exigences en matière de génération d’images. Et puisqu’il faut un vainqueur, notre choix se porte bien entendu sur Midjourney. Nous espérons que Firefly s’améliore et nous restons en veille sur son évolution. Nous n’en sommes qu’aux débuts de l’aventure avec l’IA, l’aube d’une nouvelle ère.


A noter :

Firefly assure que ses images sont clairement identifiées comme ayant été réalisées avec l’IA. Mais où ? Nous n’avons trouvé nulle trace dans le fichier final de cette mention, qui plus est certainement très facilement modifiable.

Les deux plateformes sont soumises à modération. Certains mots de votre prompt peuvent ainsi ne pas être exploités par Firefly. Midjourney compte pour sa part sur la communauté pour signaler les images litigieuses.

Lire aussi : Photographie : l’IA est déjà partout !