Zubnet AIसीखेंWiki › Image-to-Image
AI का उपयोग

Image-to-Image

इसे भी कहा जाता है: img2img, Image Conditioning
एक मौजूदा छवि और एक text prompt के आधार पर एक नई छवि बनाना। शुद्ध noise से शुरू करने (text-to-image) के बजाय, diffusion प्रक्रिया इनपुट छवि के एक noisy संस्करण से शुरू होती है, prompt के अनुसार इसे संशोधित करते हुए इसकी संरचना को संरक्षित करती है। "इस फ़ोटो का cyberpunk संस्करण" composition को रखता है लेकिन शैली और विवरण को बदल देता है।

यह क्यों मायने रखता है

Image-to-image फ़ोटोग्राफ़ी और AI कला के बीच का सेतु है। यह आपको sketches, फ़ोटो, या मौजूदा कलाकृति को शुरुआती बिंदु के रूप में उपयोग करने देता है, layout और composition बनाए रखते हुए AI शैली को बदलता है, विवरण जोड़ता है, या सामग्री को पुनः कल्पित करता है। यह text-to-image की तुलना में अधिक नियंत्रणीय है क्योंकि आप दृश्य संरचना के साथ आउटपुट को मार्गदर्शित कर रहे हैं, न कि केवल शब्दों से।

गहन अध्ययन

तंत्र: इनपुट छवि लें, इसे latent space में encode करें (VAE encoder के माध्यम से), "denoising strength" पैरामीटर के अनुपात में noise जोड़ें (0.0 = कोई परिवर्तन नहीं, 1.0 = शुद्ध noise = text-to-image), फिर text prompt पर conditioned होकर denoise करें। 0.3 strength पर, आउटपुट सूक्ष्म संशोधनों के साथ इनपुट से बहुत मिलता है। 0.8 strength पर, यह काफ़ी हद तक पुनः कल्पित है लेकिन बुनियादी composition बनाए रखता है।

Denoising Strength

Denoising strength मुख्य पैरामीटर है: यह नियंत्रित करता है कि आउटपुट इनपुट से कितना भटक सकता है। कम strength (0.2–0.4): मामूली शैली परिवर्तन, रंग समायोजन, सूक्ष्म विवरण जोड़ना। मध्यम strength (0.5–0.7): composition को संरक्षित करते हुए महत्वपूर्ण शैली परिवर्तन। उच्च strength (0.8–1.0): बड़ी पुनः कल्पना, इनपुट से केवल अस्पष्ट संरचनात्मक समानता। अपने उपयोग के मामले के लिए सही strength खोजने के लिए प्रयोग आवश्यक है।

Sketch-to-Image

एक शक्तिशाली img2img workflow: एक मोटा sketch बनाएँ (यहाँ तक कि MS Paint में भी), इसे मध्यम-उच्च denoising strength के साथ इनपुट छवि के रूप में उपयोग करें, और वांछित आउटपुट का वर्णन करें। Sketch spatial layout प्रदान करता है (वस्तुएँ कहाँ हैं, उनका सापेक्ष आकार) जबकि AI सभी कलात्मक विवरण भरता है। यह AI image generation को किसी भी व्यक्ति के लिए सुलभ बनाता है जो stick figure बना सकता है — composition आपसे आता है, rendering AI से।

संबंधित अवधारणाएँ

← सभी शब्द
← Image Segmentation Induction Head →
ESC