Prompts pour Dall-E : le guide complet
Vous utilisez Dall-E pour générer des images ? On vous partage les meilleurs conseils et les bonnes pratiques pour rédiger des prompts efficaces.
Les progrès de l’IA Midjourney permettent aujourd’hui de créer des photos au rendu époustouflant en seulement quelques clics. Mais pour arriver à un résultat satisfaisant il est nécessaire d’apprendre à rédiger un prompt efficace, qui respecte certaines règles de base.
Si rien ne remplace une formation au prompt engineering comme celle proposée par Jedha, nous vous livrons dans cet article 5 conseils d’expert pour vous aider à améliorer la qualité de vos prompts sur Midjourney. Et pour vous donner une idée du rendu possible avec ce modèle d’IA générative, nous vous partageons aussi 5 exemples de prompts optimisés.
Depuis 2022, les versions de Midjourney se succèdent si rapidement qu’il n’est pas toujours évident d’appréhender les nouvelles fonctionnalités qui sont introduites. Il est cependant indispensable de connaître les avancées de ces modèles afin de générer les prompts les plus adaptés et de tirer profit au maximum des capacités de l’IA.
Entre la V1 publiée en février 2022 et la V6 sortie en décembre 2023, les développeurs de ces modèles de machine learning ont réalisé d’énormes progrès, tant sur le plan de la qualité d'exécution technique que de celui de la créativité. Les visages autrefois déformés et les détails irréalistes ont laissé place à des productions d’une justesse inégalée dans le monde de l’IA.
Voici les principales évolutions entre la V5 et la V6 de Midjourney :
Pour vous donner un exemple de l’évolution des propositions faites par Midjourney, voici un comparatif de chaque version depuis la V1 jusqu’à la V6 pour le prompt suivant :
“Photography of medieval knights with swords and shields jumping into battle from landing helicopter”
Afin d’écrire un prompt efficace pour Midjourney, il est d’abord important d’avoir les bases dans la création de prompts, quel que soit le modèle d’IA générative utilisé. Ensuite, il est essentiel de prêter attention à certaines fonctionnalités propres à Midjourney. Vous ne les connaissez pas ? Pas de panique, nous allons vous expliquer tout ça, et partager nos astuces et les bonnes pratiques afin de prendre en main ce modèle d’IA générative.
Mais attention, si vous souhaitez maîtriser les meilleures techniques de prompt engineering et rédiger des prompts vraiment efficaces et optimisés, il vous sera nécessaire de suivre une formation dédiée au prompt engineering.
Rédiger un prompt, c’est donner une consigne à la machine. Plus celle-ci sera riche et précise, plus le résultat attendu sera pertinent. Avec Midjourney, tout ce que vous ne précisez pas est généré de façon automatique par l’IA, ce qui peut apporter une dose de créativité mais aussi générer des rendus aléatoires !
Pour commencer, l’essentiel est de définir le style d’image que vous souhaitez (style de dessin : BD ;style de peinture : impressionniste ;style photographique : photo réaliste), puis le traitement de la lumière attendu (“warm light”, “sunset soft light” ou même des effets de contraste ou d’ombre portée sur certains éléments).
En plus d’être complet, nous vous conseillons de préciser tous les paramètres que l’IA devra prendre en compte. Pour cela, vous pouvez utiliser la commande “--” suivie du paramètre à définir. Par exemple, pour le ratio d’une image vous pouvez écrire “--ar 16:9” ou pour sa qualité “--quality <.25>.
S’il est essentiel de donner des informations à Midjourney pour que l’IA puisse travailler, vous devez le faire de façon rigoureuse, car dans l’art du prompt engineering la forme compte ! L’ordre des mots et leur agencement est important, si bien que la meilleure chose à faire est de rédiger des phrases ultra-descriptives en prenant soin de vérifier la syntaxe et la ponctuation que vous utilisez.
Un conseil : n’hésitez pas à avoir recours aux prompt négatifs en utilisant la commande “no” qui précède le terme que vous ne voulez surtout pas voir dans le rendu généré par Midjourney.
Pour apporter plus de justesse à votre rendu, précisez dans votre prompt l’angle de vue que vous souhaitez obtenir (“close up photo”, “ultra-wide framing” ou “low-angle shot”), ainsi que la profondeur de champ (“blur in the background” ou “depth of field” par exemple).
Avec la nouvelle version de Midjourney, vous pouvez ajuster le cadrage de votre composition en intégrant la fonction “zoom out” qui permet de dézoomer sur le rendu qui vous est proposé. Enfin, si vous vous y connaissez en photo, vous avez la possibilité de citer des modèles de boîtier et d’objectifs pour demander à l’IA de générer des photos avec un style particulier.
La nouvelle version de Midjourney permet d’inverser la logique habituelle de rédaction d’un prompt en passant par la commande /describe au lieu de celle /imagine. Concrètement, vous proposez à Midjourney une image, et l’IA génère 4 propositions de prompts adaptés qui auraient pu donner le résultat obtenu. Cette fonctionnalité vous permet de noter des tournures de phrase et des mots-clés couramment utilisés par ce modèle pour parler dans sa langue et ainsi mieux vous faire comprendre !
En utilisant le mot-clé “Quality” suivi d’une mention de valeur allant de .25 (moins bonne qualité) à 2 (qualité très élevée), vous pouvez améliorer la qualité du rendu par défaut effectué par Mijourney. Mais attention, si vous choisissez d’augmenter la qualité, cette opération vous coûtera davantage de crédits.
Un générateur de prompts est un outil qui vous aide à rédiger des instructions détaillées à donner à un modèle d’IA générative, à partir de mots clés et d’idées que vous lui donnez. Aussi appelé prompt helper ou prompt builder, ce type d’outil est conçu pour vous faire gagner du temps et de l’efficacité en créant pour vous une consigne sur-mesure et optimisée pour le modèle d’IA de votre choix.
Afin de vous donner un aperçu de ce qu’il est possible de faire grâce à ce modèle d’IA, nous vous proposons cinq exemples d’images générées sur Midjourney et les prompts utilisés pour y parvenir.
Imagine Vector graphic logo of frog, simple minimal, by Rob Janoff --no realistic photo details
Style : Logo, Ratio d'aspect : 1:1, Taille : 520 x 520
Cet exemple de prompt pour un logo sous Midjourney met en lumière l’importance des références artistiques et l’utilisation de la négation, essentielle à un rendu de qualité.
Imagine Blonde beauty, bathroom, soap in hand, by the window, shelf on the bathtub, bright sunlight, fresh colors, minimalist style, beautiful image, smiling, happy, comfortable state of mind, scene image, simple, bokeh effect, portrait fixed focal length lens shot, photographic texture, 8k HD,::1
Style : Portrait, Ratio d'aspect : 1:1, Taille : 1024 x 1024
Ce prompt pour un portrait réaliste de femme respecte globalement les règles de base, bien qu’il soit assez long et puisse comporter des éléments contradictoires difficiles à traiter par l’IA. Une deuxième version de ce rendu pourrait corriger le problème de la main tenant le savon, ici peu réaliste.
Imagine exterior of a cutting-edge sports arena that features dynamic LED lighting and a retractable roof, convenient for some of the world's biggest sports events --ar 16:9
Style : Architectural, Ratio d'aspect : 16:9, Taille : 775 x 435
Si le rendu de ce prompt d’architecture photoréaliste pour Midjourney est de très bonne qualité, on peut relever qu’il n’intègre pas la mention du toit rétractable.
Imagine prompt: A fashion e-commerce website with a modern and edgy design. The home page features a full-screen hero image with a call-to-action button, and the product pages are designed with clean lines and high-quality images to showcase the items. ::4.5 spotlight::1.1 DSLR::0.9 Yoji Shinkawa::1.2 edgy::2.1 silver color::1.3 --ar 3:4 --v 5
Style : Web design, Ratio d'aspect : 3:4 pour chaque rendu, Taille : 928 x 636 pour chaque rendu
Ce prompt est réalisé sous la version 5 de Midjourney, il été relancé pour donner les deux rendus rassemblés sur l’image.
Imagine still frame of a short but piloted humanoid mecha with squat legs standing by a car, residential American neighborhood, daytime, full view, anime, 1999
Style : Anime, Ratio d'aspect : 2:3, Taille : 1344 x 896
Ce prompt d’animé pour Midjourney donne un rendu de grande qualité, en référence à l’univers des bandes dessinées.
Nous vous avons partagé tous nos conseils pour concevoir des prompts efficaces sur Midjourney. Si vous souhaitez aller encore plus loin dans ce domaine, sachez que nous proposons une formation courte pour devenir Prompt Engineer. Elle dure 5 jours et peut être financée par votre CPF.
Nous proposons également de nombreuses autres formations dans le domaine de la data. Pour les connaitre, vous pouvez télécharger le syllabus de nos formations et vous inscrire à nos Soirées Portes Ouvertes organisées chaque jeudi à 18h.
Midjourney est un modèle d’intelligence artificielle générative qui permet de générer des images à partir de courts textes appelés prompts. La première version de Midjourney a été publiée par David Holz en février 2022, soit un an après DALL-E, son concurrent direct créé par la firme américaine OpenAI.
Midjourney et Dall-E sont les deux modèles d’IA les plus connus et les plus utilisés pour générer des images à partir de textes. Ces générateurs d'image par IA sont capables de créer des visuels à partir de descriptions textuelles. Midjourney est réputé pour générer des images réalistes plus pertinentes que Dall-E, en jouant notamment sur les lumières. Côté créativité, si DALL-E n’est pas en reste, Midjourney semble là-aussi avoir un peu d’avance en générant des images qui prennent mieux en compte les détails mentionnés dans les prompts.
Pour utiliser Midjourney, il faut d’abord vous rendre sur le serveur Discord dédié qui vous donnera accès au salon désigné pour les nouveaux venus. En suivant les indications et en choisissant les paramètres qui vous conviennent le mieux, vous pourrez commencer à tester vos premiers prompts et à voir le rendu en seulement quelques secondes !
Au-delà de l’offre gratuite limitée à 25 crédits (soit environ 25 générations d’images), Midjourney propose 4 offres payantes par abonnement mensuel, dont un Basic Plan à 10$ par mois pour 3,3h de GPU (soit le temps nécessaire aux serveurs pour générer l’image demandée), équivalent à environ 200 images.
Parmi les alternatives gratuites à Midjourney, on retrouve bien-sûr Dall-E, mais aussi les modèles d’IA comme Binge Image Creator, Stable Diffusion ou encore Craiyon.