Zubnet AIसीखेंWiki › Image Segmentation
AI का उपयोग

Image Segmentation

इसे भी कहा जाता है: Semantic Segmentation, SAM, Instance Segmentation
एक छवि में प्रत्येक pixel को एक श्रेणी में वर्गीकृत करना। Semantic segmentation pixels को class (सड़क, फुटपाथ, इमारत, आकाश) के अनुसार लेबल करता है। Instance segmentation अलग-अलग वस्तुओं को अलग करता है (व्यक्ति 1, व्यक्ति 2)। Panoptic segmentation दोनों करता है। Meta का SAM (Segment Anything Model) बिना कार्य-विशिष्ट प्रशिक्षण के एक point click या text prompt से किसी भी वस्तु को segment कर सकता है।

यह क्यों मायने रखता है

Segmentation छवि सामग्री की सबसे सटीक समझ प्रदान करता है। Self-driving कारों को pixel-स्तर की सड़क सीमाओं की आवश्यकता होती है, न कि केवल bounding boxes की। Medical imaging को सटीक tumor सीमाओं की आवश्यकता होती है। Photo editing को background हटाने के लिए सटीक object masks की आवश्यकता होती है। SAM की बिना किसी प्रशिक्षण के किसी भी वस्तु को segment करने की क्षमता ने इस पहले विशेष क्षमता को सभी के लिए सुलभ बना दिया।

गहन अध्ययन

पारंपरिक segmentation मॉडल (medical images के लिए U-Net, सामान्य दृश्यों के लिए DeepLab) विशिष्ट श्रेणियों पर प्रशिक्षित हैं और fixed-class outputs उत्पन्न करते हैं। वे अपने प्रशिक्षण domain में अच्छी तरह काम करते हैं लेकिन नई वस्तुओं को segment नहीं कर सकते। SAM (Kirillov et al., 2023, Meta) ने 11 मिलियन छवियों में 1 अरब masks पर प्रशिक्षण लेकर इसे बदल दिया, "objectness" की एक सामान्य धारणा सीखकर जो बिना fine-tuning के किसी भी domain में स्थानांतरित होती है।

SAM और इसका प्रभाव

SAM एक prompt (एक point click, एक bounding box, या text) लेता है और इंगित वस्तु के लिए एक segmentation mask उत्पन्न करता है। यह उन छवियों पर काम करता है जो इसने कभी नहीं देखीं, उन वस्तु प्रकारों के लिए जिन पर इसे विशेष रूप से प्रशिक्षित नहीं किया गया — microscopy छवियाँ, satellite तस्वीरें, कलाकृतियाँ। SAM 2 ने इसे वीडियो तक विस्तारित किया, frames में सुसंगत object segmentation बनाए रखते हुए। प्रभाव: ऐसे कार्य जिनके लिए पहले domain-विशिष्ट प्रशिक्षण और महंगे annotation की आवश्यकता थी, अब बिना किसी सेटअप के काम करते हैं।

अनुप्रयोग

Medical imaging: निदान और उपचार योजना के लिए tumors, अंगों और कोशिकाओं को segment करना। Autonomous driving: pixel स्तर पर drivable surface, lane markings और बाधाओं को समझना। Photo/video editing: सटीक background हटाना, object चयन और compositing। कृषि: aerial imagery से फसल स्वास्थ्य का विश्लेषण। Robotics: grasping और manipulation के लिए object सीमाओं को समझना।

संबंधित अवधारणाएँ

← सभी शब्द
← Image Generation Induction Head →
ESC