Midjourney ; une Intelligence Artificielle (IA) qui va générer du texte en image de tout ce que vous voulez (ou presque).

Qu’est-ce que Midjourney ?

Midjourney (MJ)c’est deux choses à la fois.

D’abord c’est un laboratoire de recherche indépendant qui, je cite « explore de nouveaux supports de pensée et développe les capacités d’imagination de l’espèce humaine« . Waaaaow… Rien que ça.

Du coup, ils ont développé un programme d’intelligence artificielle (IA) qui va produire des images à partir d’un ‘prompt‘ ou ligne de commande en français. Le truc un peu incroyable, c’est que la ligne de commande en question ne ressemble pas du tout à du charabia de code informatique, mais à une simple ligne de texte.

Par exemple vous tapez :

« A fairy goddess flying over a planet » (Une déesse fée volant au-dessus d’une planète)

Et vous au bout de quelques secondes, vous obtenez ça

A-fairy-goddess-flying-over-a-planet

Pas mal, non ?

L’équipe a eu la bonne idée d’appeler également son IA Midjourney. Comme ça, on ne risque pas de confondre.

Du coup, sous ce terme on retrouve un labo mais aussi une intelligence artificielle (IA) « text-to-image » qui va vous permettre de créer de l’art à partir d’une ligne de texte.

Si le concept même vous semble incroyable, je vous conseille de consulter notre article sur les meilleurs générateurs texte en image actuellement disponibles.

Personnellement, après quelques tentatives, sélections et upgrade j’ai obtenu l’image ci-dessous avec la ligne « Horned demon dressed in a big cape on an old path, gothic » (Démon cornu habillé d’une grande cape sur un vieux chemin, gothique).

Ce n’est peut-être pas archi-top, mais c’est un de mes premiers essais. Et croyez-moi sur parole quand je vous dis que si je l’avais dessiné ou peint moi-même, ça aurait été un poil moins bien.

Ce que l’IA testée est actuellement capable de faire

Vous pouvez bien sûr générer une image à partir de texte, mais vous pouvez également lui donner l’URL d’une image comme source. Le résultat semble cependant un peu décevant selon ceux qui ont beaucoup pratiqué cette technique.

Question résolution maximale que vous pourrez avoir avec une image, elle est de 2048×2048.

L’IA peut générer n’importe quelle requête (qui n’entre pas dans les domaines d’exclusion) en à peu près tous les styles auxquels vous pouvez penser.

Comment accéder à la version bêta de Midjourney

Pour accéder à la version bêta dès maintenant, voici la marche à suivre.

Avant même de vous inscrire à quoi que ce soit, il vous faut un compte « Discord ». Les gamers savent de quoi je parle s’ils jouent en ligne, les autres vont devoir se rendre sur la page d’ouverture de compte et en créer un.

Pour ceux qui ne connaissent pas, c’est une application gratuite de chat vocal, vidéo et textuel utilisée par des dizaines de millions de personnes à travers le monde. Elle est utilisée pour discuter et retrouver différentes communautés et amis dans une multitude de salons.

Si par exemple vous appartenez à une guilde de Jeu de rôle en ligne, il y a de grandes chances que les membres possèdent un groupe sur cette plateforme afin de pouvoir se parler en direct, se laisser des messages, des photos, des vidéos et plein d’autres choses.

L’installation préalable de Discord est indispensable car M.J. utilise l’utilise comme une interface de communication entre les utilisateurs et l’IA texte en image elle-même. Maintenant que vous possédez un compte, vous pouvez postuler à la phase de Bêta test.

Rendez-vous sur le site web de Midjourney, cliquez sur le bouton « Join the Beta« 

Acceptez l’invitation pour rejoindre leur Discord.

midjourney 001 invitation discord

Et voilà. Vous êtes dans l’essai gratuit, ce qui va vous permettre de réaliser environ 25 requêtes (ligne de texte). Chaque requête peut créer quatre images.

Une fois votre quota épuisé, si vous souhaitez poursuivre l’expérience, vous pouvez vous inscrire à l’adhésion de base ou à l’adhésion standard.

Comment utiliser l’IA texte en image Midjourney

Une fois dans le groupe Discord de Midjourney allez dans un salon « newbie-xx » (n’importe lequel) qui se trouve dans les « Newcomers Room ».

Une fois que vous y êtes, tout en bas vous avez une ligne de commande. Tapez :

« /imagine » (sans les guillemets).

Cela va faire apparaître une fenêtre avec ‘prompt’.

À vous d’y mettre ce que vous voulez que Midjourney vous dessine (en anglais). Cela prend une vingtaine de secondes pour quatre propositions.

Voilà un de mes essais :

Ce qui m’a donné cela dans un premier temps ceci ;

midjourney 4 images

Une fois les quatre propositions faites, vous pouvez soit en choisir l’une des 4 pour la « upscale » (l’agrandir), soit pour en avoir des variations. Ce sont les boutons U1-U4 et V1-V4 en dessous.

midjourney upscale variation refresh

Le bouton « refresh » sur la droite (les deux flèches type recyclage) va refaire 4 nouvelles propositions à partir de la même requête.

Pour sauvegarder une image ; Vous pouvez à tout moment cliquer sur une image et cliquer sur « ouvrir l’original » pour la voir à taille normale. Il vous suffit de faire un clic droit et « enregistrer l’image sous… » pour la récupérer sur votre machine.

Au final j’ai « upscale » une fois celle en bas à droite pour l’avoir en 1024×1024 et j’ai obtenu ceci.

midjourney a_beautiful_painting_of_an_elf_woman_in_a_serene_mini1

Comment savoir combien de crédit il vous reste dans Midjourney

Pour savoir combien de temps machine il vous reste, allez sur le groupe Discord de MJ dans l’un des salons « nouveaux arrivants » (« newcomers rom > newbies-xx ») et dans la ligne de commande, tapez :

« /Info » (sans les guillemets)

Cela va ouvrir une boîte d’information qui va vous indiquer le nombre de requêtes qu’il vous reste. Cela devrait ressembler à ça.

Si vous cliquez sur le lien « Visit our website for more information » vous serez redirigé sur la page d’abonnement de Midjourney.

Comment obtenir des crédits sur Midjourney

Pour pouvoir utiliser l’IA, vous devez disposer de « temps machine » que l’on obtient par l’intermédiaire d’un système de plans.

Il en existe trois pour l’instant plus l’essai gratuit, mais cela peut changer. Les formules disponibles sont ;

  • Essai gratuit
  • Basique
  • Standard
  • Corporate (entreprise)

Chaque plan donne accès à du temps machine. Une minute de temps machine correspond à peu près au traitement d’une requête. Les variations sont plus rapides et les agrandissements sont plus longs.

L’inscription vous attribue directement le plan essai gratuit qui va vous donner droit à 25 minutes d’utilisation du processeur graphique en mode rapide (Fast GPU Time) qui n’est jamais réinitialisé.

Une fois ce temps épuisé, il faudra prendre un abonnement payant si vous souhaitez pouvoir faire de nouvelles requêtes. Les plans donnent des temps machines rapide renouvelés tous les mois, et à partir du plan à 30$/mois une possibilité d’utiliser le mode « Relax » qui va vous mettre en file d’attente pour chaque requête mais avec lequel vous avez la possibilité de générer un nombre illimité d’images. C’est gratos, mais c’est lent.

Voici un tableau récapitulatif des plans et tarifs de Midjourney et ce à quoi ils vous donnent droit.

Essai GratuitBasicStandardEntreprise
PrixGratuit10$ / mois30$ / mois600$ /an
Temps processeur Rapide25min (1 fois)200min /mois15h / mois120h /an
Temps processeur RelaxAucunAucunIllimitéIllimité
Mode compteur*NonOuiOuiOui
Équivalence en nombre d’images
(fast / Relax)
20/0200900 / Illimité7 200 / Illimité

* Le mode compteur vous permet d’acheter du temps machine rapide à raison d’une heure (60 images à peu près) pour 4$.

Si vous souhaitez en savoir plus et que vous savez lire l’anglais, vous pouvez consulter la section « facturation et licence » de la documentation.

Pour vous offrir un abonnement vous pouvez depuis Discord taper la commande :

« /subscribe« 

Puis suivre le lien vers la page d’abonnement, soit vous rendre sur cette page (vous devez être sur la page Discord de MJ pour y accéder).

Les limites (en 2022)

La plus évidente est, comme vous avez pu le remarquer, que tout est en anglais. C’est un problème pour beaucoup, même si les traducteurs comme Google Translate peuvent vous tirer partiellement d’affaire.

La plus grosse limitation selon moi de cette IA au moment ou j’écris cet article, est la représentation des mains, des visages et des yeux. Parfois on obtient un bon résultat du premier coup et parfois, ce qui est généré est carrément flippant. Ce n’est d’ailleurs pas spécifique à MJ puisque toutes les IA « text-to-image » ont tendance à sérieusement ramer avec le sujet.

Cependant, les résultats tendent à s’améliorer avec les versions et on trouve de plus en plus de trucs et astuces pour obtenir de biens meilleurs rendus qu’auparavant.

L’autre limitation actuelle est une limitation volontaire de la part des développeurs. Comme pour les autres outils de ce type, la volonté des équipes est d’obtenir la norme « PG-13 » qui est une certification américaine qui veut dire qu’un produit est d’une nature telle que des personnes de tous âges peuvent l’utiliser, mais qu’un accompagnement parental est suggéré, en particulier pour les enfants de moins de 13 ans. Donc pas de violence, drogues, harcèlement, contenu pour adultes, gore, agressivité et autres.

Pour essayer d’atteindre cet objectif, certains mots sont donc bannis des requêtes. Et mine de rien; il y en a un paquet… Petite liste non exhaustive ;

« Blood,  Bloodbath, Crucifixion, Bloody, Flesh, Bruises, Car crash, Corpse, Crucified, Cutting, Decapitate, Infested, Gruesome, Kill (as in Kill la Kill), Infected, Sadist, Slaughter, Teratoma, Tryphophobia, Wound, Cronenberg, Khorne, Cannibal, Cannibalism, Visceral, Guts, Bloodshot , Gory, Killing, Surgery, Vivisection, Massacre, Hemoglobin, Suicide« 

Bien sûr vous ne pourrez pas non plus mentionner tout ce qui a un rapport avec une partie de l’anatomie féminine, et même « lingerie » ou « bra » (soutien-gorge). Bref, on reste sur du politiquement correct voire limite censure puisque certains noms d’hommes politiques non plus ne sont pas autorisés. Mais certains seulement… Il ne faudrait pas se voir interdire d’accès à des marchés importants d’Asie si vous me suivez…

Les œuvres générées par MidJourney peuvent-elles être utilisées à des fins commerciales ?

Si vous n’êtes pas un membre payant, vous pouvez utiliser vos images sous la licence internationale Creative Commons Noncommercial 4.0 Attribution.

Si vous êtes un membre payant, vous pouvez utiliser les actifs (les images) que vous créez sans restriction. Vous pouvez utiliser, copier, modifier, fusionner, publier, distribuer, vendre des copies de vos créations.

Midjourney ou Dall-E 2 ? Quel est le meilleur ?

Dall-E 2 et MJ sont les deux grands concurrents à l’heure actuelle, même si d’autres AI pointent le bout de leur nez comme le Imagen de Google et Stable Diffusion de Stability.ai.

J’ai passé du temps à rechercher et comparer les résultats de même requêtes sur les deux IA. Si DALL-E 2 est plus efficace pour représenter fidèlement la requête et plus performant en termes de photo réalisme.

Midjourney est plus puissant si vous souhaitez réaliser des compositions spécifiques dans des styles particuliers en une résolution solide jusqu’à 2048×2048. Par contre, tout est payant.

Exemples avec les mêmes requêtes sur DALL-E 2 et Midjourney réalisée par Jim Clyde Monge

midjourney vs dalle 2 Animated Pixar movie about two motorcyclists
midjourney vs dalle 2 Spongebob Squarepants painted by Pablo Picasso, oil on canvas
« Bright summer afternoon, flowing river, lush nature, studio Ghibli style »
midjourney-vs-dalle-2-Bright-summer-afternoon-flowing-river-lush-nature-studio-Ghibli-style

On lit souvent que « Si vous préférez du graphisme fantastique médiéval ou fantasmagorique, c’est plus MJ. Si vous voulez de l’ultraréalisme, c’est plutôt DALL-E 2. ».

« C’est pas faux » comme dirait Perceval. Mais comprenez bien que chaque IA peut réaliser en gros ce que vous voulez. La partie difficile est de savoir comment lui demander. De plus, tout cela est très changeant puisque les développeurs changent des paramètres en permanence.

À titre d’exemple, un mode a été rajouté il y à quelques jours sur MJ permettant d’avoir un « meilleur photo réalisme« .

Le terme est faible… Je vous laisse juger. La première est de Nathan Shipley.
Celle de droite est de moi au premier essai (en clair, n’importe qui peut le faire).

beautiful_blond_woman_smiling_close_up_8k_photorea_mini 400

Pour finir, si vous devez produire beaucoup, Midjourney est probablement le plus rentable puisque si vous passez au plan standard (30$/mois), vous avez accès au mode relax avec lequel vous allez attendre plus longtemps pour chaque requête mais dans lequel on ne vous décompte plus rien.

Pour DALL-E 2 après le quota offert dépassé, c’est 15$ pour 460 images. Donc si vous prévoyez beaucoup plus que 900 images par mois, MJ est plus intéressant.

Notre avis sur Midjourney

Midjourney est l’un des outils efficaces pour produire des images créatives et artistiques pour ceux qui se demandent comment créer de l’art alors qu’ils ne savent pas dessiner une pomme.

Il n’est pas nécessaire non plus de « s’y connaître en informatique ». Même si vous ne lisez aucun mode d’emploi, vous obtiendrez quelque chose qui peut être bluffant. Si vous savez écrire un SMS ou un e-mail, vous pouvez l’utiliser. C’est beaucoup plus simple à utiliser qu’un Photoshop ou autre.

Il vous suffit de préciser ce que vous souhaitez visualiser, et le robot s’occupe du reste. Mais vous ne pouvez pas vraiment prévoir ce que Midjourney va vous donner. Parfois, vous ne recevez pas précisément ce que vous espériez. Et même des fois pas du tout, et vous vous retrouvez avec quelque chose qui ne ressemble en fait à rien. Surtout si vous y mettez du texte. Cependant, il arrive fréquemment que vous receviez une image étonnamment cool, voire carrément splendide.

Si votre truc c’est le photo réalisme ce n’est probablement vers cette IA que vous devrez vous tourner (pour l’instant). Mais si vous souhaitez produire des concepts artistiques, des œuvres d’art dans une grande variété de genre, et donner vie à vos idées les plus folles, il va faire votre bonheur.

Selon l’efficacité avec laquelle vous allez décrire ce que vous souhaitez obtenir avec un peu de pratique et de paramètres du genre « very detailled« , « Hyperrealistic » ou encore « 4k« , vous pouvez influencer le robot Midjourney dans une certaine mesure.

Une autre chose à savoir, c’est que ce truc est une vraie addiction si vous accrochez. Des idées de requêtes de plus en plus farfelues vont vous venir, avec des réglages de plus en plus précis ou au contraire délirants… Bref, on a du mal à s’en détacher.

C’est assez difficile et cela prend du temps à maîtriser. Comme tous les outils. Mais vous ne pourrez jamais être certain de ce que le robot va produire. C’est la composante aléatoire qui peut vous énerver ou vous offrir une création bien au-delà de vos attentes. C’est un peu une loterie, et cela donne à Midjourney un aspect plus ludique incontestable.

Alors… Vous venez jouer ?

Allez ; encore une petite pour la route. C’est trop beau.

city_skylines_nightlight_airplane