Le guide pratique des invites de diffusion stables
Points clés à retenir
- Divisez les invites en catégories telles que le sujet, l'éclairage, le style artistique, l'artiste et la communauté.
- Utilisez des invites négatives pour affiner les images : ajoutez des mots comme « laid » pour éviter certains éléments.
- Ajustez la pondération des mots clés dans votre invite en ajoutant des parenthèses pour souligner les mots.
Stable Diffusion peut faire passer la génération d'images IA à un niveau supérieur avec de nombreux paramètres détaillés à explorer, mais cela signifie également qu'obtenir de bons résultats n'est pas vraiment intuitif. Cependant, comprendre seulement quelques techniques clés vous aidera à surmonter cet obstacle.
Un aperçu rapide de la diffusion stable : obtenir de bonnes images
Il existe de nombreux générateurs d'images IA et Stable Diffusion est parmi les plus populaires en raison de sa nature open source et du contrôle avancé dont vous disposez sur la génération d'images.
Mais cela signifie également qu’il peut être difficile d’obtenir immédiatement de belles images. J'ai passé beaucoup de temps à utiliser le générateur d'IA Midjourney, qui produit des images esthétiques presque sans effort. En comparaison, Stable Diffusion demande un peu plus d’efforts pour apprendre.
Le moyen le plus rapide d'obtenir de bons résultats consiste à rédiger une description détaillée, à ajouter une invite négative pour éviter les éléments indésirables, puis à affiner l'image en modifiant la pondération des mots-clés et des idées dans votre invite.
Maîtrisez ces bases et vous serez sûr de pouvoir créer de très belles images à chaque fois.
Rédaction d'une description détaillée
Commençons par la description. Avec Stable Diffusion, vous devez rédiger des invites détaillées si vous souhaitez produire des images époustouflantes. Étudier les invites des autres est un moyen fantastique de voir comment cela se passe.
Nous utiliserons la vidéo ci-dessus comme exemple. L'invite ressemble à ceci :
Portrait of a cosmic goddess, suit made out of stars and galaxies and cosmic energy, intricate, headshot, highly detailed, digital painting, artstation, concept art, sharp focus, cinematic lighting, illustration, art by argerm and greg rutkewski, alphonese much, cgsociety
Cette invite est composée de 38 mots, ce qui vous donne une bonne idée de jusqu'où vous devez pousser votre description. Heureusement, il n'est pas trop compliqué de comprendre quel type de mots est utilisé dans cet exemple. J'ai fait une analyse rapide de cette invite et j'ai découvert qu'il existe sept catégories dans lesquelles vous pouvez diviser les mots-clés.
- Sujet : Portrait d'une déesse cosmique, un costume composé d'étoiles, de galaxies et d'énergie cosmique
- Tir : tir à la tête
- Éclairage : éclairage cinématographique
- Détail : mise au point complexe, très détaillée et nette
- Style artistique : Peinture numérique, concept art, illustration
- Artiste : Illustrations d'Argerm et Greg Rutkewski, Alphonse Mucha
- Références communautaires : ArtStation, CGsociety
L’utilisation d’un modèle d’invite peut être très utile pour trouver une première idée. En voici un que l'auteur de la vidéo utilise :
Sujet, action, arrière-plan, éclairage, style, artiste
Il n'y a pas de règle stricte quant aux mots-clés à inclure ou dans quel ordre, à l'exception du fait que les mots au début de l'invite ont une plus grande importance et apparaîtront plus en évidence dans l'image.
Voici un autre modèle que vous pouvez expérimenter :
- Sujet : par ex. femme, homme, centaure
- Pose : par ex. debout, assis, regardant par la fenêtre, dormant
- Détails : par ex. vêtements, couleur de cheveux, accessoires, accessoires
- Environnement : par ex. bureau, plage, forêt, château médiéval
- Descripteurs de qualité : détails fins, complexes
Au fil du temps, vous pourrez choisir un modèle qui vous donnera les meilleurs résultats. En attendant, vous pouvez cependant utiliser ces modèles pour commencer.
Utiliser des invites négatives
Les invites négatives sont un outil que vous pouvez utiliser pour améliorer vos images en indiquant au système d'IA ce que vous ne voulez pas voir. S'il y a des personnes aléatoires sur votre image, vous pouvez écrire « aucune personne » dans l'invite négative pour essayer de les supprimer.
Au début, cela peut ressembler à une solution magique, mais ce n’est pas tout à fait vrai. Parfois, l’ajout d’un seul mot supplémentaire à une invite négative modifiera soudainement et radicalement votre image d’une manière inattendue.
La relation entre l’invite négative et l’image peut souvent être difficile à comprendre. Il ne semble pas y avoir de messages négatifs universels qui fonctionnent à chaque fois. Cependant, il existe des mots généralement populaires que la communauté Stable Diffusion a fini par utiliser.
Ce YouTuber propose le modèle d'invite négative suivant que vous pouvez essayer :
kitsch, ugly, oversaturated, grain, low-res, blurry, bad anatomy, poorly drawn face, extra limb, poorly drawn hands, missing limb, floating limbs, disconnected limbs, malformed hands, blur, out of focus, long neck, long body, ugly, poorly drawn, childish, mangled, old, surreal
Dans un autre cas intéressant, cet utilisateur de Reddit explique comment et pourquoi il utilise l'invite négative suivante :
Caricature, horreur corporelle, mutant, facebook, youtube, nourriture
Les trois premiers devraient être évidents et expliquer pourquoi je ne veux pas qu'ils influencent mes photos de personnes ordinaires. Les trois derniers tentent de filtrer une grande partie du nuage de balises d’optimisation des moteurs de recherche (SEO) qui contamine de nombreuses images de l’ensemble de données.
Essayez vous-même certaines de ces balises d’invite négatives pour voir comment elles influencent vos images. Il est utile de commencer petit, avec seulement quelques mots dans votre invite négative, afin que vous puissiez voir comment les mots affectent l'image.
Affiner vos résultats
Une fois que vous avez pris l'habitude d'écrire des invites d'image détaillées et d'utiliser l'outil d'invite négative pour supprimer les éléments indésirables de l'image, la meilleure chose à apprendre est de savoir comment « pondérer » certains mots pour mettre en valeur certaines parties de votre image.
Vous pouvez le faire en ajoutant des crochets à n'importe quel mot de l'invite sur lequel vous souhaitez que le système d'IA se concentre, par rapport aux autres mots de votre description. Si vous souhaitez mettre l'accent sur « banane », par exemple, vous pouvez écrire l'invite suivante : Un bol de fruits, (bananes), pommes, fraises.
Dans cette vidéo, vous pouvez voir plusieurs exemples de ce qui arrive à une image lorsque le poids est placé sur les différents fruits dans la description. L'ajout de crochets à un mot augmentera l'importance de cet élément dans votre image. Vous pouvez ajouter plusieurs supports pour ajouter plus de poids.
Vous pouvez également mettre le mot en surbrillance et appuyer sur Ctrl ou Commande, ainsi que sur la flèche Haut ou Bas pour modifier le poids. . Si vous utilisez ce raccourci, il ajoutera également une valeur à côté du mot.
Par défaut, chaque mot-clé de votre invite aura un poids de 1. Vous pouvez l'utiliser comme point de départ pour augmenter ou diminuer le poids. Un poids de 2 ou 3 produira des résultats extrêmes, par exemple, il est donc préférable de procéder par petits incréments comme 1,2 ou 1,3, etc. Jouer avec la pondération des mots est l'un des moyens les plus simples de perfectionner votre image.
Commencer par une description solide avec de nombreux détails, puis passer aux invites négatives et à la pondération des mots clés, sont quelques-uns des meilleurs principes fondamentaux à apprendre en diffusion stable. Avec ces points à l’esprit, vous pourrez commencer à créer exactement les images que vous souhaitez.