Zubnet AIसीखेंWiki › Ideogram
कंपनियाँ

Ideogram

इसे भी कहा जाता है: इमेजों में टेक्स्ट रेंडरिंग, Ideogram 2.0
एआई इमेज जेनरेशन कंपनी, जो पूर्व गूगल ब्रेन अनुसंधानकर्ताओं द्वारा स्थापित की गई थी। इमेज जेनरेशन में सबसे कठिन समस्याओं में से एक को हल करके अपना नाम कम कर लिया: इमेज के अंदर पढ़े जा सकने वाला, सटीक टेक्स्ट रेंडर करना।

यह क्यों मायने रखता है

आइडिओग्राम ने साबित कर दिया कि एक निर्णायक कमजोरी — AI द्वारा उत्पादित छवियों में पढ़े जा सकने वाला टेक्स्ट — को हल करना, छवि उत्पादन के भीड़ भाड़ वाले क्षेत्र में एक अद्वितीय बाजार स्थिति बनाने में सक्षम हो सकता है। टेक्स्ट रेंडरिंग विशेषज्ञों से एक पूर्ण-विशेषता डिज़ाइन प्लेटफॉर्म बने रहने के उनके विकास ने दिखाया कि जब तकनीकी भेदभाव वास्तविक कार्य प्रक्रिया में दुखद बिंदुओं पर निशाना बनाता है, तो यह अधिक धन से सुसज्ज प्रतियोगियों के साथ प्रतिस्पर्धा कर सकता है।

गहन अध्ययन

आइडिओग्राम की स्थापना 2022 में मोहम्मद नोरूज़ी द्वारा की गई थी, जो गूगल ब्रेन में पूर्व वरिष्ठ अनुसंधान वैज्ञानिक थे, और उसी लैब से कई सहयोगियों के साथ। टोरंटो आधारित टीम उस समूह से आई थी जिसने गूगल पर छवि उत्पादन के मूल कार्यों में योगदान दिया था, जिसमें इमेजन मॉडल के योगदान भी शामिल थे। मिडजर्नी और डैल-ई के साथ सीधे प्रतिस्पर्धा करने के बजाय, उन्होंने बाजार में हर मॉडल को प्रभावित करने वाली एक विशिष्ट, चिंताजनक कमजोरी को निशाना बनाया: पाठ रेंडरिंग। यदि आप 2023 में डैल-ई या स्टेबल डिफ्यूज़न से "फ्रेश कॉफ़ी" लिखे गए एक दुकान के बोर्ड के लिए छवि उत्पन्न करने के लिए पूछते हैं, तो आपको "फ्रेश कॉफ़ी" के बजाय "फ्रेश कॉफ़ी" जैसा कुछ मिलता है — जो अजीब लगता है लेकिन उपयोगी नहीं। आइडिओग्राम ने इसे ठीक करने के लिए निर्णय लिया।

पाठ की समस्या को हल करना

एआई छवियों में पाठ रेंडरिंग बहुत कठिन होता है। डिफ्यूज़न मॉडल लैटेंट स्पेस में काम करते हैं, जहां पिक्सल स्तरीय तीव्रता अनिवार्य रूप से नुकसानदायक होती है, और एक पढ़े जा सकने वाला "R" और एक गुंडा बॉब के बीच केवल कुछ मानों का सही स्थान होता है। आइडिओग्राम के दृष्टिकोण में पाठ के स्तरीय संरचना और पाठ में स्थानीय संबंधों के बारे में मॉडल के बेहतर अनुभूति के लिए प्रशिक्षण समय नवाचार शामिल थे। जब आइडिओग्राम 1.0 लॉन्च किया गया, तो परिणाम खुद बोलते थे: पोस्टर, पुस्तक कवर, उत्पाद चिह्न और चिह्न जिनमें वास्तव में पढ़े जा सकने वाला पाठ था। यह पूर्ण रूप से अच्छा नहीं था — असामान्य फॉन्ट और लंबे अनुच्छेद अभी भी इसे बाधित करते थे — लेकिन यह उपलब्ध कोई भी अन्य चीज़ से बहुत बेहतर था। ग्राफिक डिज़ाइनर और मार्केटर जिन्हें वास्तविक पाठ के साथ त्वरित मॉकअप की आवश्यकता थी, इसके लिए बदलाव आवश्यक था। एक ऐसा उपकरण जो केवल लगभग लिख सकता है एक खिलौना है; एक जो वास्तव में लिख सकता है एक उत्पाद संसाधन है।

निश्चित ट्रिक से पूर्ण प्रतियोगी तक

आइडिओग्राम केवल "पाठ रेंडरिंग कंपनी" रह सकता था, लेकिन उनके बड़े उद्देश्य थे। मध्य 2024 में जारी आइडिओग्राम 2.0 एक वास्तविक कदम था समग्र छवि गुणवत्ता में — न केवल पाठ के लिए, बल्कि फोटोरियलिस्टिक सीन, चित्रण शैलियों और डिज़ाइन संरचनाओं के लिए भी। मॉडल में मजबूत प्रम्प्ट अनुसरण और एस्टीटिक संवेदन थी जो इसे मिडजर्नी v6 और डैल-ई 3 के सीधे प्रतियोगिता में रखती थी। आइडिओग्राम 2.0 के आने तक, कंपनी ने 80 मिलियन डॉलर से अधिक के निवेश एकत्र कर लिए थे, जिसमें एंड्रिसन होरोविट्ज़ द्वारा नेतृत्व वाला एक महत्वपूर्ण श्रेणी A शामिल था। उत्पाद एक विशेष उपकरण से एक सामान्य उद्देश्य वाले रचनात्मक प्लेटफॉर्म में बदल गया, जिसमें वेब आधारित संपादक, शैली समायोजन और डिज़ाइन टीमों के लिए सहयोगी विशेषताएं शामिल थीं।

डिज़ाइन कार्यप्रवाह के कोण से

संबंधित अवधारणाएँ

ESC