Techniquement, les prompts négatifs fonctionnent via le classifier-free guidance (CFG). Pendant la génération, le modèle calcule deux prédictions : une conditionnée sur le prompt positif et une conditionnée sur le prompt négatif. La prédiction finale se déplace vers le conditionnement positif et s'éloigne du négatif : final = négatif + échelle × (positif − négatif). L'échelle de guidage contrôle la force avec laquelle le modèle suit les prompts.
La communauté a développé des prompts négatifs standards pour les problèmes courants : « flou, basse qualité, artefacts jpeg » (qualité), « doigts en trop, mains déformées, membres en trop » (anatomie), « texte, filigrane, signature, logo » (éléments indésirables), « laid, défiguré, mauvaises proportions » (qualité générale). Beaucoup d'utilisateurs ont un prompt négatif par défaut qu'ils incluent avec chaque génération. Des prompts négatifs personnalisés traitent les problèmes spécifiques au domaine.
Les prompts négatifs fonctionnent avec les modèles qui supportent le classifier-free guidance (la plupart des variantes de Stable Diffusion, Flux). DALL-E 3 et Midjourney n'exposent pas les prompts négatifs comme fonctionnalité accessible — ils gèrent les problèmes de qualité via leur réécriture de prompts et mécanismes de qualité internes. La tendance dans les modèles plus récents est de réduire le besoin de prompts négatifs en améliorant la qualité par défaut, mais ils restent précieux pour un contrôle précis dans les modèles ouverts.