Prompt négatif : Définition et signification — Wiki IA

Une description textuelle de ce que tu ne veux pas dans une image générée, utilisée à côté du prompt principal. Prompt : « un beau paysage. » Prompt négatif : « flou, basse qualité, texte, filigrane, personnes. » Le modèle s'éloigne activement des concepts du prompt négatif pendant la génération. Les prompts négatifs sont principalement utilisés avec Stable Diffusion et d'autres modèles de génération d'images ouverts.

Pourquoi c'est important

Les prompts négatifs sont l'un des outils les plus efficaces pour améliorer la qualité de la génération d'images. Sans eux, les modèles ont tendance à produire des artefacts (zones floues, doigts en trop, filigranes de texte) parce que ceux-ci apparaissent fréquemment dans les données d'entraînement. Un prompt négatif bien construit élimine les modes d'échec courants et te donne plus de contrôle sur la sortie sans changer le prompt positif.

En profondeur

Techniquement, les prompts négatifs fonctionnent via le classifier-free guidance (CFG). Pendant la génération, le modèle calcule deux prédictions : une conditionnée sur le prompt positif et une conditionnée sur le prompt négatif. La prédiction finale se déplace vers le conditionnement positif et s'éloigne du négatif : final = négatif + échelle × (positif − négatif). L'échelle de guidage contrôle la force avec laquelle le modèle suit les prompts.

Prompts négatifs courants

La communauté a développé des prompts négatifs standards pour les problèmes courants : « flou, basse qualité, artefacts jpeg » (qualité), « doigts en trop, mains déformées, membres en trop » (anatomie), « texte, filigrane, signature, logo » (éléments indésirables), « laid, défiguré, mauvaises proportions » (qualité générale). Beaucoup d'utilisateurs ont un prompt négatif par défaut qu'ils incluent avec chaque génération. Des prompts négatifs personnalisés traitent les problèmes spécifiques au domaine.

Pas tous les modèles les utilisent

Les prompts négatifs fonctionnent avec les modèles qui supportent le classifier-free guidance (la plupart des variantes de Stable Diffusion, Flux). DALL-E 3 et Midjourney n'exposent pas les prompts négatifs comme fonctionnalité accessible — ils gèrent les problèmes de qualité via leur réécriture de prompts et mécanismes de qualité internes. La tendance dans les modèles plus récents est de réduire le besoin de prompts négatifs en améliorant la qualité par défaut, mais ils restent précieux pour un contrôle précis dans les modèles ouverts.